方格子文章瀏覽量一直沒有公開,這對創作者來說當然是很好的,但也因此失去了參考一個重要的數據指標。通常,這個指標是用來顯示文章的熱度。當然,文章的熱度不只一種,還包括留言數、大家對這篇文章的討論、喜歡的人數、收藏數,以及閱讀完畢的比例。這些都是很好的數據,基本上來說,留言、討論、愛心、收藏這些都是會寫進資料庫裡的數據,所以不用擔心有流失的問題。至於閱讀完畢的比例,其實就有一些判斷上的決策需要做處理。
我一直認為,方格子本身對這個閱讀力、點閱率的數據是有完整的判斷資料,才會有一般部落格平台沒有的文章閱讀完整率的這個數字。因為這個數據的判斷比點閱率的判斷要來的更為深入以及更難判斷。卻突然有聽說以前是有公開過,後來不知道什麼原因點閱率就被取消了。他說他知道有很多人點閱率可以造假,這點是很正常的現象,因為大家為了賺取流量很可能就用不正常的手段去做增加瀏覽量。人為增加瀏覽量的做法衝高自己的瀏覽量好讓文章的排名排在前面。
做這種以不正常的方式做點閱率的增加大概有兩種模式,一種就是人為的模式,一種就是機械的模式。人為的模式就是利用許多帳號去做登入的動作,然後對同一篇文章做點擊以增加這個文章的點閱率。當然,這個情況也同樣適用在留言、愛心跟收藏,都是可以這樣的操作的。這種情況在文章平台不太有必要去做操作,更多的是在購物網站。因為購物網站有商店評審系統,所以他們會用很多的預備帳號,好自己幫自己建立好的評論,增高自己的商譽,以避免因為評價而被淘汰。
另一種機械的模式也就是所謂的利用程式的方式點閱這篇文章,造成非常多次的瀏覽量,讓這篇文章的流量非常高。所以有創作者認為這種方式並不公平,顯示文章閱讀量的方式並不公平。其實他的顧慮也不是沒有原因的,因為這樣子對沒有使用機械方式點閱的文章就形成了不公平的排擠現象。所以,他認為不要公開點閱率比較好,這樣就不會引起有人使用點閱率去做操作。
其實如果有這樣顧慮的話,那留言、愛心跟收藏都同樣會有這種問題存在,因為他們都可以用機械的方法下去增加很多愛心、留言跟收藏。
要避免某一個數據被不正常的手段去增加,其實有很多種方法可以參考或處理。像某些平台會限制你發文章的次數,例如超過10分鐘以上你才能再次發表你的留言,或者30分鐘只能發一篇文章,限制每天的愛心數量,他可以自行設定時間。非常細緻的下去做程式判斷的。同一個人通常閱讀文章在同一個時間內很多次,你自然就可以把它合併成為一次而不是很多次,因為他有相同的 IP、相同的文章 ID,很多相同的特徵可以去判斷。
再深入一些說,其實每一個連結都是由系統設定出來的,例如 https://vocus.cc/salon/65952126fd89780001a71818 代表的就是方格子沙龍的一篇文章,後面加一組代號 ID 號碼表示他是誰。又例如 https://vocus.cc/article/65b91b0efd8978000159cdf9 代表的就是這是方格子一篇文章的代碼,文章的程式後面加一組代碼告訴文章的程式去哪裡找到這一篇文章顯示給對方看。
這個代碼是多位數的,我的理解通常就是某些代碼是特定的用途,有某些代碼是流水號,還有某些代碼可能是密碼。我不需要去拆解這個代碼的內容,因為我不是駭客,我不需要也不想去處理這些傷腦筋的事情。不過我我知道他組合的原理,因為其實我寫程式也是這麼做的。
誰來判定這個文章是不是合理的點閱?這個問題其實包含了以下幾個方面:你要把這個文章的反饋資訊回傳給誰的那個IP位址,你知道送出去的時間、送出去的程式、送出去的流水號、送出去的參數、送出去的代碼、送出去的密碼、Cookie等等,這些都是你可以使用的工具。只要組合起來,你就可以判斷這個點閱是不是合理的。
後台程式設計師可以參考以下方法來判斷點閱是否合理,網路上也有許多告訴你如何處理這些問題的代碼或程式,可以供你抄寫或應用。只是不知道你所使用的程式是,Java、Python、C++還是其他,例如PHP或其他各式各樣的後台程式語言。我不需要說得這麼細,因為其實這就是會牽涉到平台的整個商業機密。我可以說明他的原理,但我不能說得太清楚。
通常,參數可以幫助判斷這個點閱歷史是不是假的,或是他有可能是機械的用電腦程式的方式來進行處理的。這個要靠後台程式設計師對他反饋的那個Log紀錄檔是不是有進行登錄的動作。通常我們會對那個記錄檔進行登入的動作,就是把每一筆登入檔都會形成一個記錄檔,並且定期的做檢查的動作。
檢查的方式有幾種,檢查有沒有駭客攻擊你的系統或資料庫,特別是有些系統參數或反饋的代碼或密碼裡面有含Select這一類SQL資料庫指令的程式碼。如果有就一定要判斷這個東西是不是能攻破你的資料庫、你的防火牆,進入你的資料庫寫入你的資料庫的資料。
檢查有沒有同一個時間對同一支程式有極大數量的點擊,通常點擊都會有頻率性或集中性。有可能3分鐘發生一次,也有可能一分鐘內發生3000次。這種都是不正常的現象,必須要排除。甚至寫入程式中傳遞給特定的程式去反攻這種連續的攻擊。直到對方電腦當機。
判斷使用者操作程序是不是符合一般人在瀏覽頁面的習慣,如果不是,也要加以檢視,了解他為什麼要這樣做。要判斷文章瀏覽量是否合理,需要後台程式設計師根據各種因素進行綜合判斷。網路上也有許多相關的資源可以參考。
這些都是平台系統程式設計師經常會碰到的問題,甚至是每天都需要處理的工作。有時候我會對程式設計師說:「恭喜你今天只有3萬4千次攻擊,其實不多。」因為大部分的駭客攻擊其實都是段數不高的流量點閱方式。段數真正高的有非常多種,例如模擬正常使用者,甚至用破解正常使用者的密碼偽裝成使用者來進入系統篡改他的資料。
其實這已經不光是處理點閱率正確與否的問題,而是整個後台系統的資安管理問題。但做好了資安管理問題,同時你也就能夠分析判斷如何去處理解決而有所懷疑的這個瀏覽量是造假的問題。因為其實你有能力處理,只要你仔細把後台的Log檔做好分類判斷的動作,你就能夠了解如何撰寫程式去改善這個問題。
以上是應有人要求寫的,也算是我在夢中說的一些夢話,聽的人聽,不聽的人就不聽吧,當作聊天就是了。