最近有一類帖子刷屏了:搜索雪白、鮮嫩時,百度搜索到的是清涼美女,而谷歌搜索到的是雪景和食物。對于這種搜索水平的差異,我很早就意識到了。最近幾年講大數據,我常用一張PPT比較“寶鋼 郭朝暉”的搜索差異(我當時還在寶鋼工作)。我常會對學員說:這就是智能和智障的差異。
對于這件事,有知情人士這樣為百度開脫:
一開始搜“嫩滑”,百度確實出性暗示結果。但這個不是百度的引導,而是中國用戶確實最多點擊那些性暗示結果,百度系統習得數據而成。谷歌中文的搜索結果清新,也許正因其中文數據庫的稚嫩。機器學習學的是用戶行為,在此事上,不是百度色情,而是上百度反應出了真實的人類數據。Google進中國之后,機器學習也會越來越色情。
百度怎么會搜到雪白的美女了呢?簡單地說,就是根據搜索量來的:如果一個詞在兩篇文章中出現,一篇文章被搜索了1萬次,一篇被搜索了1次。則搜索引擎會把搜索1萬次的文章或者圖片推送給你。因為人們點擊的、帶有“雪白”的文字中,更多是美女的照片。所以,百度就把美女推送出來了。
但是,把責任推給網民是不合適的。
對人工智能感興趣的人都知道,谷歌在人工智能領域非常領先。這其實是有基因的。谷歌創立之初,投資人問他們:現在搜索引擎這么多,你們為什么還要搞? 結果得到的回答是:我們搞的不是搜索,是人工智能!
按照我的理解,所謂的“智能搜索”,首先要“猜”的就是用戶輸入要搜索的文字時,到底想看什么。顯然,多數人搜索“雪白”時,想看的應該是雪景——如果要看雪白的美女,不如直接搜“美女”,誰會搜索“雪白”呢? 所以,智能的推送應該考慮更深層的邏輯:對那些更可能用其他方式搜索的文章或圖片,應該降低其優先級。
如果有人把“吃飯”理解為吃“米飯”、把“讀書”理解為“念課文”,大家會覺得這人有點智障。所以,智能和智障的差異,往往就是理解“內涵”和“字面”的差異。百度創立了這么多年,還只停留在搜索次數排序,卻沒學會猜測用戶的意圖,距離“智能”的要求確實遠了點。李彥宏還想“再贏一次谷歌”,大概也只能繼續用下三濫的辦法了。
寫到這里,突然想到昨晚看到的一個報道:貪污了2.7個億的華融集團董事長賴小民,去年接受中央媒體采訪時,卻強調自己如何學習黨的文件。我突然困惑了:這樣的人,到底是智能呢,還是知障?
更多關于材料方面、材料腐蝕控制、材料科普等方面的國內外最新動態,我們網站會不斷更新。希望大家一直關注中國腐蝕與防護網http://www.ecorr.org
責任編輯:韓鑫
《中國腐蝕與防護網電子期刊》征訂啟事
投稿聯系:編輯部
電話:010-62313558-806
郵箱:fsfhzy666@163.com
中國腐蝕與防護網官方 QQ群:140808414
免責聲明:本網站所轉載的文字、圖片與視頻資料版權歸原創作者所有,如果涉及侵權,請第一時間聯系本網刪除。

官方微信
《中國腐蝕與防護網電子期刊》征訂啟事
- 投稿聯系:編輯部
- 電話:010-62313558-806
- 郵箱:fsfhzy666@163.com
- 中國腐蝕與防護網官方QQ群:140808414