相關指標定義:
①中國網際網路用戶(Internet User of China):DCCI執行相對嚴格的定義,即每周至少登陸、使用、訪問網際網路至少一次者方被定義為中國網際網路受眾/用戶。
②統計樣本(Sample):DCCI根據CNNIC及中國國家統計局等機構頒布的中國網際網路用戶分布結構及中國人口分布結構,在註冊、安裝中國網際網路客戶端固定樣本組(Panel)軟體的用戶範圍內,依據樣本結構進行隨機抽取、反向剔除、身份確認。用戶需要實名註冊、在統計周期內持續安裝、正常運行中國網際網路客戶端固定樣本組(Panel)軟體,且用戶本人必須符合中國網際網路用戶特徵參數的受眾/用戶。月度到達率統計樣本要求該樣本一個月之內的四個平均分布的時間段至少登陸、使用、訪問過網際網路四次或者四次以上。
③搜尋引擎用戶(Search engine user):月度時間區間內,在統計樣本中,至少發出一次關鍵字搜索請求的中國網際網路用戶。
④訪問(Visit):用戶與網站產生交互行為,發出一個訪問請求並且在用戶端完成頁面下載過程,計為一次訪問。
⑤月度到達率(Monthly reach rate):指中國網際網路客戶端固定樣本組(Panel)Netmonitor網絡監測系統月度符合樣本結構等要求的有效統計樣本中當月至少主動成功訪問過一次某特定網站的樣本量占當月有效樣本總量的百分比。
⑥月度人均不重複搜索關鍵字數(Average unduplicated key words per search engine user per month):某搜索網站平均每個進行過關鍵字搜索的用戶對該搜索網站在一個月內發出的不重複的關鍵字搜索請求的總數量。
⑦月度人均搜索次數(Search times per search engine user per month):某搜索網站平均每個進行過關鍵字搜索的用戶對該搜索網站在一個月內發出的任何一個十分鐘間隔內不重複的關鍵字搜索請求的總數量。
⑧月度人均搜索翻頁數(Search result pages per search engine user per month):某搜索網站平均每個進行過關鍵字搜索的用戶對該搜索網站在一個月內的使用搜尋引擎的翻頁數量(包括搜索結果的第一頁)。
⑨月度人均單次搜索翻頁數(Average search result pages per search):該指標為月度人均搜索翻頁數除以月度人均搜索次數的值。
相關數據調研方法:
DCCI採用基於客戶端固定樣本組(Panel)監測方法的Netmonitor網絡監測系統。相關技術、樣本、方法、規範、指標均為國際範圍內進行網站/媒介監測和受眾/用戶測量最前沿、最主流的標準。Netratings、Comscore等在北美、歐洲等國家和地區進行廣泛、連續的網際網路監測時也採用類似的panel方法。通過用戶許可協議,按照嚴格的樣本招募方法招募固定樣本群(panel),通過樣本授權許可的客戶端軟體實時持續統計固定樣本組的上網行為,統計分析網際網路受眾的應用行為、習慣、需求、消費,科學、進行深入系統的網站/媒介的連續性監測。
Netmonitor系統經過2005、2006兩年時間的開發,2007年開始大規模募集樣本。截止到2007年底,符合結構等指標要求的有效樣本量已經超過5萬個,2008年樣本規模將有成倍增加。樣本募集嚴格執行客戶端固定樣本組(Panel)監測方法的樣本結構要求,對中國網際網路受眾/用戶的總體統計誤差要求在1%(置信度95%)範圍內,對網站/媒介要求統計誤差在5%(置信度95%)範圍內。
基於客戶端固定樣本組(Panel)監測方法的Netmonitor系統,能夠實現傳統調研方法、網站/媒介自身所不能實現的動態、立體監測。基於客戶端固定樣本組(Panel)的監測方法,與以下幾種方法在樣本、技術、規範、指標、定義等方面完全不同:基於瀏覽器插件的信息收集與統計、應用軟體附帶進行的用戶信息採集與統計、Alexa基於插件的網站排名、基於網頁套嵌碼的流量統計、基於網站日誌的數據統計、基於線下或者線上問卷進行的調研統計等。所以,相關統計數據以及能夠產生的結果也存在較多差異。
相關數據統計差異:
1.樣本募集結構、流程、定義和數據統計結果的差異。
基於客戶端固定樣本組(Panel)的監測方法,有效受眾/用戶的樣本的募集和確認,基於CNNIC和國家統計局關於網際網路用戶結構和中國人口分布結構,嚴格執行隨機抽取、反向剔除、身份確認的原則。用戶在自願、許可原則下實名註冊、安裝並持續正常運行調查軟體。樣本隨時間推移進行更新、補充和校正。相關樣本募集的流程、結構和原則避免了其它方法,尤其是基於插件的排名數據結構和結果失衡問題(插件即樣本,或者無法基於用戶信息進行深入的樣本控制),也避免了作弊者通過程序提交虛假數據、製造流量、沖高排名等問題;樣本募集採取非付費原則,避免了有償樣本的數據結構失真問題;更為嚴格的受眾/用戶定義(其他機構定義為半年訪問一次或者只要訪問一次即計為一個用戶),使得系統所能產生的統計結果更加符合使用相關數據的產業投資者、網站決策者、廣告投放者等專業人群的標準和需要。
2.方法本身的技術、局限和數據統計結果的差異。
以客戶端固定樣本組(Panel)監測方法與伺服器端基於頁面代碼或者網站日誌的監測方法相比較為例,前者相對於某一特定網站而言為抽樣統計因而數據可能存在一定偏差,後者相對於某一特定網站為站內抽樣或站內全流量統計數據因而相對完整。但是由於技術、費用等原因後者實際也經常採用站內抽樣方法,另外由於數據來自站內,在外部的可信度偏低。
前者能夠同時實現對受眾/用戶訪問的幾乎所有網站和網際網路使用行為的監測、統計,能夠對流量、用戶進行各種橫向統計分析,採用統一的樣本、方法、指標、時間區間,而後者往往只能夠在局部、在不同網站的不同時間段實現一個或者數個網站的流量數據統計,樣本、指標、時間區間等不盡一致。
在數據結果上的差異是最主要的,以訪問網站的獨立用戶數(UV)、頁面瀏覽數(PV)、訪問時長(duration)等3個指標的統計為例:
獨立用戶數(UV)的統計差異:如果受眾/用戶端電腦中Cookie被刪除或者曾經被刪除狀態,則網站伺服器端依據Cookie,對於訪問該網站的用戶數量統計結果會偏高。Comscore出具的一份研究報告曾經向美國業界表明,伺服器端對用戶數量的統計可能因此偏高30%以上。
頁面訪問量(page views)的統計差異——在伺服器端的監測統計方式之下,機器人、搜索爬蟲、作弊程序等帶來的非有效用戶頁面訪問請求都有可能被記錄為有效頁面訪問。受眾/用戶向伺服器發出訪問請求後即使頁面下載不完整、不成功,只要伺服器記錄到了訪問請求都可能會被計為有效頁面訪問。每次訪問30分鐘之內連續點擊同一個地址向同一個頁面發出多次訪問,可能會被記錄為多個PV;頁面打開後很快被關閉沒有形成有效瀏覽的頁面訪問也會被計為有效PV。客戶端固定樣本組(Panel)監測方法中,這些都不會被記錄為有效PV。
訪問時長的統計差異:客戶端固定樣本組只統計用戶電腦當中的當前活動窗口的活動時間且該時間有最大時長限制,同時可以測量離線時長。伺服器端監測方法目前尚不能區分當前活動窗口和非活動窗口,無法按照與用戶在客戶端發生的應用行為完全相符的方式進行統計。
實現對於網際網路網站/媒介與受眾/用戶的精確測量意義重大,但是目前中國國內各個方面尚處於初級階段。據悉,DCCI將在客戶端固定樣本組(Panel)監測方法的Netmonitor網絡監測系統的基礎上,進一步聯合業界各方不斷探索、不斷深入、不斷完善,促進客觀、有效的網際網路數據的產生和使用,以此促進網站與用戶能見度、網絡廣告與營銷精準度的提高。