看電視會變笨?

Photobucket

完整的標題或許應該下為「學齡前兒童看電視會變

這篇文章的起點其實是看到了網路上的〈看電視會變胖 影響數學能力〉這則新聞。裡面引用了一篇醫學期刊研究的結果,顯示學齡前兒童(29個月、53個月)電視看得越多對於他們長大後(小學四年級)的學業成績有負面的影響之外,還讓他們比較喜歡垃圾食物,更讓他們容易在學校遭人欺負.....

我非常好奇這樣的研究結果。事實上,前一陣子我才看到一篇經濟學論文,Gentzkow and Shapiro(2008),探討關於電視對學齡前兒童日後學業成績的影響。有趣的是,他們的結論和上述新聞所引用的醫學研究是相左的。這引發了我進一步的好奇,然而從該則新聞裡能獲得的資訊實在太有限,於是我就去找了該篇醫學期刊論文(Pagani and Barnett(2010),以下簡稱PB)來研究了一番。很意外地,雖然是醫學期刊,不過PB的研究完全是奠基於統計方法,該篇論文是非常標準的經濟計量實證研究,使用OLS迴歸分析,通篇沒有涉及任何醫學相關專有知識,所以我能夠毫無障礙地將它閱畢。

本文簡單探討上述兩篇論文的內容,順便提及一些平均人們會對統計學所產生的重大(錯誤)迷思

首先針對PB的研究方法簡述如下。
他們從來自加拿大的新生嬰兒資料庫進行隨機抽樣,或得2837個於1997與98年出生的樣本,排除錯誤資料與無法追蹤的樣本之後是2572個「可觀察樣本」。其中438個樣本的家長拒絕參與追蹤調查,12個樣本無法取得連絡,所以有效樣本為2120個。針對這些樣本取得家長同意進行長達多年的追蹤觀察,最後獲得關於「看電視時數」、「教師學習評估」等資料以便進行迴歸分析。然而因為是多年的(消耗經費可觀的)觀察,最終的有效樣本只剩下1314個,剩餘的八百多個樣本未能提供完整的觀察資料。

這是非常嚴重的「樣本選擇(sample selection)」問題。別忘了,樣本是隨機抽來的沒錯,但樣本的離去(attrition)呢?絕對不會是純粹的隨機。當樣本的選擇離去與研究主題有關,就會嚴重威脅到OLS估計式的結果,且通常是無法直接驗證的,於是導致研究結果的不可信。這也是為什麼「網路問卷」幾乎沒有統計推論價值的原因--填網路問卷就是一種典型的樣本自我選擇的行為,研究者的樣本並非簡單隨機抽樣而來,則統計方法無助於「母體推論」,所以網路問券的結果幾乎沒有「描述特定樣本」以外的價值。

(我必須承認對網路問卷的迷思是非常多人都會犯下的錯誤。)

回到PB的論文內容。那麼多的樣本未能完成觀察(missing data)要怎麼辦?如果直接將這些樣本捨棄,同樣會摧毀樣本的隨機特性--尤其(樣本選擇退出而導致)未能觀察的樣本數高達全部的40%!為了處理這個議題,PB使用了一種名為「imputation」的統計技巧。這個方法早期的做法是透過觀察到類似的完整樣本的資料來直接取代遺漏的資料;近期的方法則有透過電腦隨機抽樣方式進行最大可能概似估計等等技巧來對遺漏的資料進行貝式推論(Bayesian inference)。白話地說,就是透過已有的資料去盡可能地推測遺漏的資料。

我的問題是,這樣的做法(在個體經濟計量的議題來說)是好的嗎?因為這是我相當陌生的資料處理手段,所以特別跑去找所上專長為個體計量實證的教授聊了一下這篇論文的內容。我個人對近十幾二十年的個體實證文獻的閱讀經驗中,印象從來沒有看過這個手法。諮詢了教授的意見,也得到一樣的答案。或許「imputation」在醫學統計的實務上很被接受(我們不甚清楚),但可以確定的是,在當代經濟學的個體計量領域--那些能夠發表到優質期刊上的論文--「imputation」幾乎沒有被採用。

因為它在計量領域的「因果推論」研究上顯然不是那麼可信。

PB的文章中也針對那些有完全觀察的樣本和沒有完全觀察的樣本進行差異分析(attrition analysis),發現兩者的家庭背景有諸多變量上的統計顯著差異。這意味著什麼?離去的樣本和留下來的樣本有背景上的顯著差異,那麼我們又要如何相信在這樣的情境之下以所謂「imputation」來填塞的遺漏資料是具有推論價值的?

困難!

樣本選擇問題對研究者因果推論所產生的重大障礙還不止於此。讓我們思考一下PB的論文到底在研究什麼。他們在研究學齡前兒童「看電視的時數」這個變數對「學業成績」、「BMI健康指數」、「是否被同儕欺負」等變數的影響。

看電視的時數。

一個人要看多少時間的電視,毫無疑問就是一種自我選擇的過程!這個過程在不同的人物之間不可能是隨機的。用統計學的術語來談,「看電視的時數」這個變量不可能是「i.i.d.(identically and independently distributed)」抽樣而來。在OLS迴歸分析的框架下,樣本不是i.i.d.,統計推論就會出錯。

這樣的問題之嚴重性並非是將「家庭背景」等個人因素在迴歸模型中進行控制,就能夠乾淨地處理掉。事實上,這正是經濟計量實證的困難之處,也是學術研究之所以有它的價值的理由。為了處理這些威脅到因果統計推論的議題,經濟計量學便不斷地改善研究方法。



Photobucket
(!)



好,既然看電視是自我選擇的變數,要如何創造統計推論所需要的隨機性?在Gentzkow and Shapiro(2008)(以下簡稱GS)的研究中,使用了所謂的「quasi-natural experiment」的方法來處理這個議題。我在第一篇《Superfreakonomics》讀後感中曾經提到裡面經濟學家研究電視的引入對於印度婦女福利的影響,使用的就是類似的手法。

GS透過美國1940和50年代電視機引入各個城市的時間差異性,來檢驗觀看電視對學齡前兒童日後學業成績的影響(數學、空間推理、字彙能力、閱讀能力、通識能力)。GS的樣本包括一出生下來就能接觸電視機的兒童,以及直到六歲才可能接觸電視機的兒童。他們的工具變數迴歸估計結果(two-stage least square)指出,多一年接觸電視機的時間,將提高兒童的平均學科成績0.02個標準差。*是的,看電視對兒童有正面的影響。不只有學業平均成績,對於閱讀與通識性測驗的分數也有所提高。GS進一步分析指出,後者的正向影響主要來自非英語母語、或母親教育程度低、或非白人家庭的樣本。

當時電視機引入的時間差是導因於一些對個體而言是外生的(exogenous)、因而可以被視為隨機的事件,提供了良好的研究環境可以隔絕「看電視」的自我選擇過程。你大概可以決定自己要看多少電視,但你鐵定無法決定電視機在什麼時候被發明、然後通過相關法律、然後被業者引進你所居住的地區。**

GS的文章結論認為,電視機對於相對弱勢的家庭其學齡前兒童的影響是相對正面的--電視機的價值必須從它會排除的其它有價值活動來評估。***這隱含對富裕家庭、優勢家庭的兒童來說,電視機可能不具顯著正面影響、甚至還可能確實存在負面影響。有趣的是,PB的差異分析指出他們剩下來的樣本來自單親家庭的比例統計顯著較低......

GS也在文章的附錄中,以相同的樣本釋例了採用類似於PB(以及許多其它認為電視有負影響的相關研究)的方法可能會產生的偏誤,使得電視的效果可正可負--暗示著這種推論方法的不可信。



直觀上,我懷疑多看電視對學齡前兒童有什麼負面影響,所以在這篇文章中我介紹了GS發表在Econ領域十分頂尖的期刊的經濟學研究,來「平衡」一下這則新聞所引用的某篇醫學統計實證結果。抱歉,我得承認我個人先驗上就不怎麼相信醫學界所具備的統計知識對經濟學領域所關注的因果推論,會具有更好的說服力--這並不是他們的專長。

回到PB的研究(與新聞標題),他們的結果也指出看電視使得孩童變胖,因為他們變得更喜歡吃零食。關於這一點,經濟學家Chou, Rashad, and Grossman(2008)有篇速食餐廳的電視廣告對兒童過胖問題的因果關係研究,指出這樣的廣告確實會造成兒童過胖問題。但我沒有細讀裡面的計量方法就是了,因為對這個議題不是那麼有興趣!在我看來過胖是可以個人意志高度主宰的問題。(攤手)






[References]
Linda S. Pagani and Tracie A. Barnett (2010). "Prospective associations between early childhood television exposure and academic, psychosocial, and physical well-being by middle childhood." Archives of Pediatrics & Adolescent Medicine, 164(5): 425-31.
Mattew Gentzkow and Jesse Shapiro (2008). "Preschool television viewing and adolescent test scores: Historical evidence from the Coleman study." Quarterly Journal of Economics, 123(1): 279-323.
Shin-Yi Chou, Rashad, and Grossman (2008). "Fast-food restaurant advertising on television and its influence on childhood obesity." Journal of Law and Economics, 51(4): 599-618.


[Notes]
*GS在文中也透過比較其它學齡前兒童環境干涉的實驗研究比較,顯示這樣的強度不只在統計上、而在經濟上也有顯著的意義。

**美國第一台取得合法執照可以播放商業節目的電視機在一九四一年七月誕生,但之後出現兩個阻礙其擴散的歷史事件:其一是第二次世界大戰,為了保留原物料而禁止了新電視台的成立;其二是1948年為期四年的暫時性地停止執照核發,理由跟「spectrum allocation」的重新設計有關(我不知道那是啥)。

***他們提醒讀者這篇論文研究的電視是1950年代的電視,電視節目的內容可能隨著時代有所改變,這樣的改變是否導致電視對兒童的影響跟著改變,是可以進一步釐清的問題。但他們提供一些看法,認為似乎沒有明顯的理由可以斷定電視節目隨時代的改變而變得對兒童觀眾具有負面性。他們引用電視節目內容研究的相關文獻支持這樣的觀點,例如:2000年的電視節目事實上比早期節目更具知性,2003在兒童間最受歡迎的節目(《The Simpsons》、《American Idol》、《Malcolm in the Middle》)看起來並沒有比起1953年最受兒童歡迎節目(《I Love Lucy》、《Superman》、《The Red Buttons Variety Show》)要來得沒有知性水準。

6 comment(s):

Shao-Chuan Yang | 07 May, 2010 00:07

風聆 | 07 May, 2010 09:47

雖然研究在方法上有些問題,但就這個主題來說,台灣電視節目的狀況倒是很有意思。
之前上到課後時間運用的單元時,有針對學生做一些簡單的調查(課程需要),結果也跟預期的差不多。
就周遭小學的孩子而言,看電視與少看電視、不看電視主要的狀況不外乎:

1.看很多電視的孩子:大多因為家長自己也很習慣看電視,而且孩子所看的節目通常與家長差不多。
在這些家庭裡,打開電視經常就好像呼吸、喝水一樣自然,所以最常看的也是24小時播放的「新聞台」。
至於呆丸新聞台裡的內容怎樣,對小孩會有什麼影響,嗯……這點其實還蠻讓人擔憂的。

2.看電視較少的孩子:這種孩子的家庭,通常家長在「看電視」的這件事上是在刻意掌控的。
有很多、非常多小孩放學後都是要上安親班、補習班的,他們在寫完功課、補習後,剩下的時間並不多。
看電視就好像獎勵一樣……所以這種小孩大多看的是卡通,而比較少是大人自己想看的節目。

3.幾乎不看電視的孩子:有極少數家長的家裡是沒有電視,或者自己本身沒在看電視的。
(我們家應該屬於這種,但因為家裡還是有人不能沒電視,只是以外其他人幾乎都不看)
當看電視的時間整個省下來時,在完成課業之外的獎勵時間,也不會是電視,
而常會是書籍、戶外活動或玩具。
由於這類家長通常習慣閱讀書籍(或者上網路),而這樣的習慣也常會影響到他們的孩子。
(有趣的是,我發現有不少對資訊較擅長的老師都會限制自己小孩不要太早使用電腦)

說老實話,我覺得與其說是「電視」本身對孩子的學習有影響,不如說是對「看電視」這件事有不同態度的家長們,會對於自己孩子有各自不同的影響。

leoheart3 | 07 May, 2010 11:03

開機
http://www.books.com.tw/exep/prod/booksfile.php?item=0010352449

EverDark | 10 May, 2010 00:43

To #2(風聆):

沒錯,父母親的價值觀會影響孩子(尤其是學齡前)的電視觀看時數。事實上在那篇醫學研究中也透過問卷調查了父母親對於觀看電視的價值判斷,用來作為迴歸模型中的控制變數。因為他們想要研究的是「其他條件均若不變、那麼學齡前孩童看電視的影響是什麼」這個問題。所以如果說看電視的效果其實都是來自父母親的管理,那麼在控制這樣的變項之後就會讓你的結果不顯著。

但這不是這一支相關文獻的研究者們所關心的問題--家長的管教對孩子當然一定會有影響。他們想知道的是即便是在排除了這層因素之後,電視到底本身是否確實能對(學齡前)孩童的課業或心靈成長造成任何顯著的影響。或者更技術一點地來談,我們想要知道的是觀看電視與比方說學業成績之間究竟是否存在「直接的因果關係」,而不是純粹只是一個反映了其它變因(例如家長管教)的「虛假相關」。

而不論是從Gentzkow and Shapiro(2008)還是Pagani and Barnett(2010)的研究來看,顯然都得到電視「本身」具有顯著影響的結論。而我個人則比較相信前者的實證結果,理由當然已經在正文中闡述。(因為就算是家長管教,也仍然暗示著孩童觀看電視本身是樣本自我選擇之下的結果。)


---

To #3(leoheart3):

嗯?
所以這是好書推薦的意思嗎?

陷阱卡發動者 | 16 May, 2010 08:56

可是GS有討論過,美國1940和50年代電視機引入各個城市的時間差異,也是完全外生的嘛?

EverDark | 16 May, 2010 13:24

To #5 (陷阱卡發動者):

有喔。
他們有在論文裡面(Section III.B)檢視外生性的問題,提出兩個可能威脅外生與否的論點並逐一檢視。
其一是當時有關當局打算最大化能夠接收到電視訊號的人數(作為一種政策目標);其二是電視台的利潤與當地購買力高度相關,所以當地市場的銷售情形或人均所得會與電視機引入與曝光率相關。GS接著便從他們的樣本資料提供統計證據支持「這兩個威脅不影響2SLS估計」的論點。技術上來說就是要告訴你這個IV(工具變數)是有效的--不但與研究變數相關、而且與模型誤差項無關。(他們的兩階段模型設定在293頁可以看到。)

Post a Comment

回應文章前請注意下列三勿原則:

1)勿拍照;(→會有靈異的照片從你的相機裡跑出來...
2)勿餵食;(→會有飢渴的猛獸從我的網誌裡跑出來...
3)勿告白。(→會有奇怪的東西從站長體內裡跑出來...

謝謝大家的配合。
( > ー <)b