第一章 調(diào)查介紹
一、調(diào)查背景
中國(guó)網(wǎng)民人數(shù)與結(jié)構(gòu)特征、互聯(lián)網(wǎng)基礎(chǔ)資源、上網(wǎng)條件和網(wǎng)絡(luò)應(yīng)用等方面情況的信息,對(duì)國(guó)家和企業(yè)掌握互聯(lián)網(wǎng)絡(luò)發(fā)展動(dòng)態(tài)和決策有著十分重要的意義。1997年,經(jīng)國(guó)家主管部門(mén)研究,決定由中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)聯(lián)合互聯(lián)網(wǎng)絡(luò)單位共同實(shí)施這項(xiàng)統(tǒng)計(jì)工作。為了使這項(xiàng)工作正規(guī)化、制度化,從1998年起,中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心于每年1月和7月發(fā)布《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》。統(tǒng)計(jì)報(bào)告發(fā)表后,受到各個(gè)方面的重視,被國(guó)內(nèi)外廣泛引用。本次為第21次調(diào)查。
該項(xiàng)工作得到了信息產(chǎn)業(yè)部等國(guó)家主管部門(mén)的大力支持,各互聯(lián)網(wǎng)單位、調(diào)查支持網(wǎng)站以及媒體等也對(duì)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心的調(diào)查工作給予了支持與配合,保證了中國(guó)互聯(lián)網(wǎng)調(diào)查工作的順利進(jìn)行。在此,謹(jǐn)對(duì)他們的支持與努力表示衷心的感謝。
二、報(bào)告術(shù)語(yǔ)界定
◇ 網(wǎng)民
中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)對(duì)網(wǎng)民的定義為:半年內(nèi)使用過(guò)互聯(lián)網(wǎng)的6周歲及以上中國(guó)公民。澳門(mén)報(bào)告中仍舊沿用 “平均每周上網(wǎng)一小時(shí)及以上”的網(wǎng)民定義。
◇ 手機(jī)網(wǎng)民
指半年內(nèi)曾經(jīng)通過(guò)手機(jī)接入互聯(lián)網(wǎng)的網(wǎng)民,但不限于僅通過(guò)手機(jī)接入互聯(lián)網(wǎng)的網(wǎng)民。
◇ 農(nóng)村網(wǎng)民
指目前居住在農(nóng)村的網(wǎng)民。
◇ 家庭上網(wǎng)計(jì)算機(jī)
指在居民家庭中連入互聯(lián)網(wǎng)的計(jì)算機(jī),包括臺(tái)式機(jī)和筆記本電腦。
◇ IP地址
IP地址的作用是標(biāo)識(shí)上網(wǎng)計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)中的其他設(shè)備,是互聯(lián)網(wǎng)中的基礎(chǔ)資源,只有獲得IP地址(無(wú)論以何種形式存在),才能和互聯(lián)網(wǎng)相連。
◇ 域名
本報(bào)告中僅指英文域名,是指由點(diǎn)(.)分割、僅由數(shù)字、英文字母和連字符(-)組成的字串,是與IP地址相對(duì)應(yīng)的層次結(jié)構(gòu)式互聯(lián)網(wǎng)地址標(biāo)識(shí)。常見(jiàn)的域名分為兩類(lèi):一類(lèi)是國(guó)家或地區(qū)頂級(jí)域名(ccTLD),如以.CN結(jié)尾的域名代表中國(guó);一類(lèi)是類(lèi)別頂級(jí)域名(gTLD),如以.COM,.NET,.ORG結(jié)尾的域名等。
◇ 網(wǎng)站
是指以域名本身或者“WWW.+域名”為網(wǎng)址的web站點(diǎn),其中包括中國(guó)的國(guó)家頂級(jí)域名.CN和類(lèi)別頂級(jí)域名(gTLD)下的web站點(diǎn)。如:對(duì)域名cnnic.cn來(lái)說(shuō),它的網(wǎng)站只有一個(gè),其對(duì)應(yīng)的網(wǎng)址為cnnic.cn或www.cnnic.cn,除此以外,whois.cnnic.cn,mail.cnnic.cn……等以該域名為后綴的網(wǎng)址只被視為該網(wǎng)站的不同頻道。
◇ 靜態(tài)網(wǎng)頁(yè)
指URL中不含“?”和輸入?yún)?shù)的網(wǎng)頁(yè),包括:*.htm、*.html、*.shtml、*.txt、*.xml等。
◇ 動(dòng)態(tài)網(wǎng)頁(yè)
指URL中含“?”或輸入?yún)?shù)的網(wǎng)頁(yè),包括ASP、PHP、PERL、CGI等在Server方進(jìn)行處理的網(wǎng)頁(yè)。
◇ 網(wǎng)頁(yè)的更新周期
指網(wǎng)頁(yè)的最后更新日期與搜索網(wǎng)頁(yè)時(shí)的時(shí)間差。
◇ 調(diào)查范圍
除非明確指出,本報(bào)告中的數(shù)據(jù)均不包括香港、澳門(mén)和臺(tái)灣地區(qū)在內(nèi)。
◇ 調(diào)查數(shù)據(jù)截止日期
本次調(diào)查統(tǒng)計(jì)數(shù)據(jù)截止日期為2007年12月31日。
三、調(diào)查方法
依據(jù)統(tǒng)計(jì)學(xué)理論和國(guó)際慣例,在前20次調(diào)查工作基礎(chǔ)之上,本次調(diào)查采用了網(wǎng)下抽樣、網(wǎng)上聯(lián)機(jī)、網(wǎng)上自動(dòng)搜索和統(tǒng)計(jì)數(shù)據(jù)上報(bào)的調(diào)查方法。
(一)電話抽樣調(diào)查
電話抽樣調(diào)查側(cè)重于了解中國(guó)網(wǎng)民數(shù)量與結(jié)構(gòu)特征、上網(wǎng)條件、網(wǎng)絡(luò)應(yīng)用、網(wǎng)民觀點(diǎn)和非網(wǎng)民狀況。目標(biāo)總體細(xì)分如下:
? 子總體A:有住宅固定電話的居民
? 子總體B:住校的高等院校學(xué)生
? 子總體C:沒(méi)有住宅電話的居民,再細(xì)分為:
? 子總體C1:有小靈通(無(wú)線市話) 的居民
? 子總體C2:有手機(jī)(移動(dòng)、聯(lián)通)的居民
? 子總體C3:無(wú)任何移動(dòng)電話的居民
小靈通屬于無(wú)線市話,接聽(tīng)免費(fèi),從訪問(wèn)實(shí)施的角度看,住宅固話與小靈通在局號(hào)上無(wú)法區(qū)分,合并兩者。即子總體A和子總體C1可以合為一個(gè)子總體訪問(wèn)。從訪問(wèn)實(shí)施的角度看,可以劃分如下:
? 子總體A+C1:有住宅固定電話(含小靈通)的居民
? 子總體B: 住校的高等院校學(xué)生
? 子總體C2: 無(wú)住宅固定電話,有手機(jī)的居民
? 子總體C3: 無(wú)住宅固定電話、無(wú)手機(jī)的居民
此次只針對(duì)子總體A+C1、B、C2進(jìn)行調(diào)研,抽樣樣本總數(shù)為46,300個(gè)。不對(duì)子總體C3調(diào)研的原因在于,子總體C3中的網(wǎng)民規(guī)模較小,考慮到隨著社會(huì)經(jīng)濟(jì)的發(fā)展,此部分人群會(huì)越來(lái)越少,忽略不訪問(wèn)。
1.子總體A+C1抽樣方法
◇ 抽樣方法
電話調(diào)查的抽樣方法是分層二階段抽樣,目的是使所抽取的樣本近似接近自加權(quán)樣本。考慮到第21次調(diào)查的結(jié)果不僅要估計(jì)全國(guó)的情況,還要估計(jì)各省的情況,所以先按省分層,在各個(gè)層中獨(dú)立抽取樣本,然后再在省內(nèi)各地市分配樣本。
◇ 抽樣指標(biāo)
在確定各省樣本量時(shí),考慮的指標(biāo)是“住宅電話覆蓋6歲及以上的人數(shù)”。確定省內(nèi)地市州樣本量時(shí),省下所有地市州都被抽中,采用地市州的“人口和經(jīng)濟(jì)指標(biāo)”建立回歸預(yù)測(cè)模型,估計(jì)該地市州的住宅電話數(shù)目,并將該地市州的住宅電話數(shù)目作為抽樣指標(biāo),樣本量按每個(gè)地市州住宅電話數(shù)占全省住宅電話數(shù)比例分配。
◇ 樣本量
各省樣本量根據(jù)第19次調(diào)查各省網(wǎng)民人數(shù)的平方根占各省網(wǎng)民數(shù)平方根之和的比例進(jìn)行分配,不足600個(gè)樣本的省份補(bǔ)足到600個(gè)。綜合考慮精度與成本,最終樣本確定為31,802個(gè)。
◇ 實(shí)施方式
根據(jù)每一地區(qū)的固定電話局號(hào)生成電話號(hào)碼,隨機(jī)排列之后撥打,對(duì)其中的家庭電話進(jìn)行訪問(wèn)。為提高訪問(wèn)成功率,采取方便原則,接電話的居民即為被訪者。訪問(wèn)被訪者的上網(wǎng)基本情況,同時(shí)詢問(wèn)其他家庭成員的性別、年齡、是否上網(wǎng)等基本情況。
◇ 加權(quán)方式
利用家庭成員的性別、年齡和學(xué)歷等基本情況對(duì)樣本總體進(jìn)行相應(yīng)加權(quán)調(diào)整,減少接電話的家庭成員不隨機(jī)對(duì)樣本造成的偏差。
◇ 抽樣調(diào)查成功率
按美國(guó)輿論研究協(xié)會(huì)(AAPOR)成功率公式三計(jì)算,本次抽樣調(diào)查成功率為36.5%。
2.子總體B抽樣方法
◇ 抽樣方法和樣本量
子總體B指在校高校學(xué)生。綜合考慮成本與精度,有效樣本量設(shè)定為4000個(gè),即全國(guó)范圍內(nèi)抽取200所高校,每校抽取20 間宿舍,每宿舍訪問(wèn)1 人。抽樣方法是分層三階段抽樣,使最終樣本為近似自加權(quán)樣本。分層指標(biāo)為省份(31個(gè)省份)和學(xué)校層次(本科、專(zhuān)科),共分為62層(31×2=62)。每層應(yīng)抽取的學(xué)校數(shù)目=該層學(xué)生數(shù)占全國(guó)學(xué)生總數(shù)的比例×200。
◇ 抽樣指標(biāo)
理想的抽樣指標(biāo)應(yīng)該是住校的學(xué)生人數(shù),由于抽樣框的限制,實(shí)際采用的抽樣指標(biāo)是在校學(xué)生人數(shù)。
◇ 實(shí)施方式
根據(jù)抽中學(xué)校的固定電話局號(hào)生成電話號(hào)碼,隨機(jī)排列之后進(jìn)行撥打,對(duì)其中的宿舍電話進(jìn)行訪問(wèn)。考慮到同宿舍的人同質(zhì)性較高,采取方便原則,接電話的學(xué)生即為被訪者。
3.子總體C2抽樣方法
◇ 抽樣方法和樣本量
子總體C2指無(wú)住宅市話,有手機(jī)的6歲及以上居民。為保證調(diào)查的實(shí)施,同時(shí)綜合考慮成本與精度,樣本量在各省的分配按照各省移動(dòng)電話的卡數(shù)占全國(guó)的比例分配,樣本量不足150個(gè)的省份補(bǔ)足到150個(gè)。總體C2樣本量為10,498個(gè)。
◇ 抽樣指標(biāo)
理想的抽樣指標(biāo)應(yīng)該是“無(wú)住宅市話的實(shí)際手機(jī)用戶數(shù)”,但是沒(méi)有這個(gè)指標(biāo)的詳細(xì)數(shù)據(jù)。實(shí)際抽樣指標(biāo)是信息產(chǎn)業(yè)部公布的各省手機(jī)用戶卡數(shù)。
◇ 實(shí)施方式
根據(jù)手機(jī)號(hào)段隨機(jī)生成手機(jī)號(hào)碼,撥打甄別出屬于子總體C2的被訪者,直到完成所要求的子總體C2樣本量。
(二)網(wǎng)上調(diào)查
網(wǎng)上調(diào)查重在了解典型互聯(lián)網(wǎng)應(yīng)用的使用情況。中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)在2007年12月8日~12月31日進(jìn)行了網(wǎng)上調(diào)查。將問(wèn)卷放置在中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)的網(wǎng)站上,同時(shí)在政府媒體網(wǎng)站、全國(guó)較大ICP/ISP網(wǎng)站與各省的信息港上設(shè)置問(wèn)卷鏈接,由網(wǎng)民主動(dòng)參與填寫(xiě)問(wèn)卷。回收問(wèn)卷后,通過(guò)技術(shù)手段進(jìn)行答卷有效性檢驗(yàn),篩除無(wú)效答卷。網(wǎng)上問(wèn)卷調(diào)查得到各大網(wǎng)站的大力支持和廣大網(wǎng)民的熱情參與。本次網(wǎng)上調(diào)查共收到調(diào)查問(wèn)卷73,332份,經(jīng)過(guò)有效性檢查處理得到有效答卷69,556份。
(三)網(wǎng)上自動(dòng)搜索與統(tǒng)計(jì)數(shù)據(jù)上報(bào)
網(wǎng)上自動(dòng)搜索主要是對(duì)域名、網(wǎng)站數(shù)量及其地域分布等指標(biāo)進(jìn)行技術(shù)統(tǒng)計(jì),而統(tǒng)計(jì)上報(bào)數(shù)據(jù)主要包括IP地址數(shù)和網(wǎng)絡(luò)國(guó)際出口帶寬數(shù)。
1.IP地址總數(shù)
IP地址分省統(tǒng)計(jì)的數(shù)據(jù)來(lái)自亞太互聯(lián)網(wǎng)信息中心(APNIC)和中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心IP地址數(shù)據(jù)庫(kù)。將兩個(gè)數(shù)據(jù)庫(kù)中已經(jīng)注冊(cè)且可以判明地址所屬省份的數(shù)據(jù),按省分別相加得到分省數(shù)據(jù)。由于地址分配使用是動(dòng)態(tài)過(guò)程,所統(tǒng)計(jì)數(shù)據(jù)僅供參考。同時(shí),IP地址的國(guó)家主管部門(mén)信息產(chǎn)業(yè)部也會(huì)要求中國(guó)IP地址分配單位(如中國(guó)電信、中國(guó)網(wǎng)通等)每半年上報(bào)一次其擁有的IP地址數(shù)。為確保IP數(shù)據(jù)準(zhǔn)確,中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)會(huì)將來(lái)自APNIC的統(tǒng)計(jì)數(shù)據(jù)與這些上報(bào)數(shù)據(jù)進(jìn)行比較、核實(shí),確定最終的IP地址數(shù)。
2.中國(guó)域名總數(shù)和網(wǎng)站總數(shù)
以下兩部分?jǐn)?shù)據(jù)相加,即可得到中國(guó)的網(wǎng)站和域名總數(shù)、分類(lèi)數(shù)與地域分布等數(shù)據(jù)。
第一部分是.CN下的域名數(shù)和網(wǎng)站數(shù),由中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)采用計(jì)算機(jī)網(wǎng)上自動(dòng)搜索得到;第二部分是中國(guó)類(lèi)別頂級(jí)域名與網(wǎng)站數(shù),由國(guó)內(nèi)各類(lèi)別頂級(jí)域名注冊(cè)單位協(xié)助提供。這些數(shù)據(jù)包括:所有類(lèi)別頂級(jí)域名(gTLD)和域名下已開(kāi)通的網(wǎng)站數(shù);按.COM、.NET、.ORG分類(lèi)的類(lèi)別頂級(jí)域名(gTLD)和網(wǎng)站數(shù);按注冊(cè)單位所在省份分類(lèi)的類(lèi)別頂級(jí)域名(gTLD)和網(wǎng)站數(shù)。
3.網(wǎng)頁(yè)數(shù)
采用計(jì)算機(jī)網(wǎng)上自動(dòng)搜索,對(duì)抽取的網(wǎng)站從其首頁(yè)(WWW+域名)開(kāi)始搜索,通過(guò)網(wǎng)頁(yè)上的層層鏈接,抓取所有屬于該網(wǎng)站的網(wǎng)頁(yè)特征及其文本內(nèi)容。將由網(wǎng)頁(yè)搜索所獲得的所有中國(guó)網(wǎng)站的網(wǎng)頁(yè)數(shù)和網(wǎng)頁(yè)字節(jié)數(shù)分別相加,得到中國(guó)網(wǎng)頁(yè)總數(shù)及網(wǎng)頁(yè)字節(jié)數(shù)。該總數(shù)不含內(nèi)容相同的重復(fù)網(wǎng)頁(yè)。
4.網(wǎng)絡(luò)國(guó)際出口帶寬數(shù)
信息產(chǎn)業(yè)部通過(guò)電信企業(yè)的報(bào)表制度,定期得到中國(guó)各運(yùn)營(yíng)商與其他國(guó)家和地區(qū)相連的網(wǎng)絡(luò)出口帶寬總數(shù)。《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》中納入了這些上報(bào)數(shù)據(jù)。
|