兩個變數的線性相關

董正林(深圳市第二高級中學)

教材:數學·人民教育出版社A版(2007年第3版)·必修三·第二章第三節

摘要:文章從最貼近學生實際的統計案例出發,精心設計問題鏈,逐步引導學生自主發現問題、合作探究問題、最終解決問題.其間大量應用現代信息技術手段(圖形計算器),不僅使教學效率和課堂容量得以顯著提升,也讓教學流程呈現出與傳統教學大不一樣的新面貌.作為案例教學,文章在緊扣「問題解決」這條主線的同時,還尤其注重數學思想、數學文化的滲透.

關鍵詞:線性回歸方程;最小二乘法;圖形計算器;統計案例教學

教學內容解析

本課作為「變數間的相關關係」第2課時,在此前的學習中,學生已經能夠理解相關關係這一概念,能通過繪製散點圖對其進行直觀及定性的描述。例如,根據散點圖判斷兩個變數間是否存在相關關係,是正相關還是負相關等.那麼接下來從定量的角度來研究相關關係是很自然的.在這個過程中可以滲透多個重要的數理統計思想,即隨機抽樣及用樣本估計總體等,可以說本節課在教材中的地位是以統計案例的形式全面整合已學的統計知識與思想.

我們可以用一條直線來近似代表變數間的線性關係,從而實現對相關關係進行定量研究的目的.顯然,在整體上與樣本點最接近的直線能最大程度地近似代表真實關係.為此我們需要建立一個量化標準,也就是對「從整體上看,直線最接近樣本點」進行精準的數學語言刻畫.這樣量化標準有很多,最經典也是最常採用的就是最小二乘思想.

以最小二乘法建立起線性回歸方程后,我們就能對所研究的問題的總體情況進行預測.將解釋變數代入回歸方程計算得到一個數值並不難,更重要地是學生需要正確理解預測值的含義,明確預測值只是實際值的一個近似,是對總體情況的一種估計.

基於上述分析,將本節課的教學重點定為理解回歸直線只是對相關關係的一種近似描述,最小二乘法只是確定回歸直線的一種方法,理解回歸方程的含義以及背後蘊含的統計思想.教學難點則是對「從整體上看,直線與樣本點最接近」進行數學刻畫,並在這個過程中引出最小二乘法這一重要數學思想.

教學目標設置

1.課程目標

學生通過對統計知識的學習,掌握一種認識客觀世界的重要思維模式(隨機思想及用樣本估計總體的思想等)和解決問題的方法.

2.單元目標

(1)掌握最基本的獲取樣本數據的方法,以及從樣本數據中提取信息的統計方法(例如,線性回歸分析及獨立性檢驗等);

(2)通過具體的統計案例讓學生掌握最基本的統計概念和思想。例如,用樣本估計總體,並學習如何用數學知識去定量刻畫實際問題;

(3)認識到概率知識是各種統計方法的理論基礎.

3.課堂教學目標

(1)了解(線性)相關關係、回歸直線、回歸方程等基本概念;

(2)認識最小二乘法的思想;

(3)能熟練操作圖形計算器進行繪圖,計算回歸方程;

(4)理解回歸方程的隨機性以及用樣本估計總體的思想.

學生學情分析

本課純粹知識層面的內容並不多,但涉及許多重要且新穎的數學思想方法,有些思想方法與學生已有的認知基礎偏離較遠。例如,學生已經習慣了一個問題無論有多少種解法,答案都是唯一確定的,但本課需要學生實現由確定性思維向統計思維的轉變,因此學生要真正做到建構知識體系、抓住本質問題、理解核心概念不是一件容易的事情.此外,學生對大量的樣本數據、複雜的公式結構以及代數運算可能心存畏懼,這些都會影響到課堂教學.有利的地方在於學生已經學習過方差的概念,能夠理解用平均數去估計總體數字特徵,以此作為其思維的最近發展區,便於其更好地認識最小二乘思想.同時,學生對新知識的旺盛求解慾望及對問題進行積極思考的態度也是順利完成本課的重要保證.

教學策略分析

根據學生情況,為了更好地達成教學重點和突破教學難點,本課採用如下教學策略。

1.注重由特殊到一般的思維引導

本課以預設問題鏈激發學生思考並推動課堂教學.問題的設置體現了由特殊到一般的認知規律,即學生先判定有限個方程中哪個方程的擬合效果更好,然後再推廣到一般情形,探究如何在所有直線中尋找最佳直線.

2.強調實驗探究,主張在學生自主活動的基礎上進行思考和領悟

例如,讓學生在散點圖中任意添加直線並求其方程,經過實驗,就會發現每個人求得的直線都不一樣,從而很自然地觸發討論,即如何建立起量化標準,用數學知識來度量到底哪一條直線才是最接近樣本點的,最終獲得最小二乘思想.

3.採用類比思考法

將最小二乘法與方差的概念進行類比,將用最小二乘意義下的回歸直線來近似代表兩個變數間的線性相關關係這一原理與以多個測量值的平均值作為某物理量真實值的估計進行類比.通過類比幫助學生更好地理解數學思想,提升思維品質.

4.注意幾何直觀與代數運算的相互轉化

例如,將回歸直線並不經過所有的樣本點這個幾何問題代數化為由回歸方程計算出來的值與實際值存在偏差,將比較各點偏差的絕對值之和這個代數問題幾何化為樣本點與直線間的斜線段的長度和最小等.

5.應用現代教育技術手段

本課內容涉及大量的圖形繪製與複雜的數據運算,用傳統教學手段既耗時費力,又難以有效推進教學.TI-圖形計算器的強大功能為數據的快捷處理提供了技術支持,讓學生有更多的時間來探究及交流,便於達成教學目標.圖形計算器在本課的應用包括如下幾個地方。

(1)搭建無線網路平台,實現數據的實時上傳與共享,即藉助圖形計算器的「即時調查」功能,現場收集學生的身高及體重數據,並將匯總後的數據實時下發給學生,一方面為本課學習營造一個真實的案例,另一方面也避免了大量數據的手工逐一輸入.

(2)運用圖形計算器的「圖形」功能,快速繪製散點圖,從散點圖中發現樣本點大致分佈在一條直線附近.在此基礎上,讓學生憑直觀感覺,在散點圖中任作一條與樣本點整體上最接近的直線,並通過「坐標與方程」功能得到該直線的方程.經過操作學生自會發現,每個人眼中的直線都不一樣,到底哪一條直線才是最接近的需要建立起量化標準,用數學語言來精準度量,從而很自然地觸發討論,最終引出最小二乘思想.

(3)利用圖形計算器,進行快速計算.包括在「列表與電子表格」中調用sum()函數求和;利用「統計計算/線性回歸」功能直接求出一組數據的線性回歸方程;尤其值得一提的是,在「計算器」頁面中調用completesquare()函數可以實現對多項式的快速配方,這樣我們就可以選取三個特殊樣本點,對目標函數進行配方,幫助學生更好地認識係數公式的來歷.

教學過程與設計

1.創設情境,激發思考

教學伊始,教師藉助圖形計算器(筆者教學中使用TI-Nspire™ CM-C CAS中文彩屏版)的「即時調查」功能發起現場調查,收集班級學生的身高體重數據.學生在手持端輸入數據並選擇提交.教師將數據匯總後傳輸給學生.學生接收數據,繪製散點圖(以身高為x軸,體重為y軸),並思考回答下列問題:

(1)體重與身高間是否具有一定的相關性?

(2)體重和身高之間是不是函數關係?隨著身體增高,體重是否一定增大?

(3)假設我們的抽樣方式合理,如何根據樣本數據推斷某一特定身高(例如,175cm)的高中生的大致體重? 能否估計身高每增加一定高度(例如,10cm),體重大約增加多少?

(4)如果要用一個函數模型來近似地描述這兩個變數之間的相關關係,你會選擇哪種常見的函數類型?

【設計意圖】現場搜集數據,創設與現實生活密切相關的問題情境,激發學生學習興趣,同時回顧相關關係的相關概念及其與函數關係的區別,引導學生用函數模型來近似描述相關關係,從而達到定量研究的目的.

2.數學實驗、提出問題

引題:如圖1所示,在直線l1和l2中,哪一條能更好地近似表現x,y之間線性關係? 為什麼?

生:l2.因為它與樣本點最接近.

師:l2是與某一個樣本點最接近嗎?

生:不是,l2隻是與所有樣本點在整體上最接近.

【設計意圖】以直觀的例子讓學生明確:只有在整體上與樣本數據最接近的直線才能較好地近似變數間的真實關係.

實驗:根據直覺,在剛才繪製的關於體重—身高的散點圖中添加一條你認為在整體上最接近樣本點的直線,並求出該直線方程.

實驗操作:以TI-Nspire™ CM-C CAS為例,按「文檔」→選「4:插入」→選「7:數據與統計」;橫軸變數名選擇「身高」,縱軸變數名選擇「體重」,即可得到散點圖;在散點圖頁面,按「菜單」→選「4:分析」→選「2:添加可移動線」,然後移動游標,拖動直線到自認為最接近樣本點的位置即可,相應的直線方程實時顯示.

學生動手操作,教師隨機展示幾個學生的實驗結果.學生觀察後會發現每位學生所認為的最接近樣本點的直線都不一樣,由此產生到底哪條直線才是最接近樣本點的疑惑學生帶著這樣的問題開啟了知識探究之旅.

代表性的樣本是必要的,由此複習隨機抽樣的重要性,並體會用樣本估計總體的思想.

5.知識總結、作業分層

師生共同回顧本課所學知識、方法與思想.教師明確點出整個線性回歸的流程本質上講是一種數學建模的過程.

作業布置

略.

參考文獻:

[1] 劉紹學.普通高中數學課程標準實驗教科書·數學3必修 [M].北京:人民教育出版社(A版).2007.

[2]連春興、方文茹.關於線性回歸教學的一點建議[J].數學通報.2007(8):19-20.

[3] 嚴興光.兩個變數的線性相關教學設計(第三課時).中小學數學(高中版).2010(12): 29-34.

你可能會喜歡