
首頁 > 中文互聯網
雖然DeepSeek-R1確實好用,但它在爆火之後,成了人手一個的AI工具,也對中文互聯網的信息環境造成了嚴重的污染情況,這是一個固然難以避免但也理應得到重視的問題。 最近一個星期以來,就我看到的刷屏文章,至少有三例都是DeepSeek-R1生成出來的、充滿了事實錯誤的內容,卻因其以假亂真的迷惑性,讓很多朋友信以為真,情緒激動的分享傳播。 第一例,是知乎的這條高贊回答: 網路圖片 即使在我指出來之後,依然有人不可置信的表示,看不出來其中的「AI味」,所謂的「AI味」,指的是DeepSeek-R1創作文本時特有的「極繁主義」,比如生造概念、堆疊名詞、濫用修辭等等。 而這條知乎回答,或因提示詞喂得好,或因後期潤色得力,在很大程度上消除了它的「AI味」,但從表達結構上,經常和AI打交道的用戶都能一眼看出痕迹,純正的DeepSeek-R1風格,當然普通人確實難以識別。 不過我也不是直接得到這個結論的,在看到朋友分享這條回答時,我原本也和他一樣,是帶著對於國產動畫電影崛起的興奮全盤接受了如此言之有物的論證,直到一個致命的紕漏讓我察覺到了不對勁。 作者說哪吒電影里的敖丙變身鏡頭在法國昂西動畫節上轟動業界,問題是,法國是有一個昂西動畫節,哪吒的電影也是送去參展過,但那是追光動畫出品的「哪吒重生」,而不是餃子導演的「哪吒」…… 而且因為審核原因,這部送展的「哪吒重生」宣傳片實際上是一部品牌概念片,內容是在一個現代都市裡的賽車動作演示,哪吒根本就沒出現,更不存在敖丙的變身…… 網路圖片 繼續查證也能發現,關於「哪吒」的製片方給員工分成都房子、攻克水下流體特效之類的描述,全都是DeepSeek-R1為了完成這篇命題作文自己腦補的。 第二個例子,就更離譜了,離譜到我不太能把完整截圖發在這裡,因為有些膽子夠粗的自媒體,已經在拿DeepSeek去寫涉軍涉政的東西了。 其中有一篇寫軍工打虎譚瑞松的選題,標題是《軍工虎譚瑞松, 從「道德標兵」到「獵艷狂魔」,「國之重器」淪為私人金庫》,原文現在已經被刪了,應該是被被轉得太廣作者害怕了,但很多「金句」的截圖還在到處傳,什麼直升機的設計圖紙在暗網裡開價200比特幣出售、收受金條賄賂時要求熔成發動機葉片形狀、某總師離職時留言這裡不是造飛機的地方而是造孽的工廠等等,如果你能記得這些細節,就一定知道我說的是哪篇文章。 不好意思,這也全都是DeepSeek-R1自己編的。 為什麼我能確信是DeepSeek-R1的手筆呢?為什麼不能是ChatGPT、Claude、文心一言?因為DeepSeek-R1是當前唯一能用的免費推理模型,且對中文的支持度足夠高,這本來是DeepSeek-R1的優勢,只是沒被用在正道上。 此時就需要補充一個推理模型的特點了,那就是推理模型的訓練過程特別注重獎懲機制,通過思維鏈的暴露我們也能看出它通常都會想得縝密、生怕自己沒有摸清用戶意圖,以致於經常到了「諂媚」的程度。 這種訓練模式的好處在於,可以讓推理模型擁有舉一反三的能力,能夠更加靈活和完善的去完成任務,但是相對的,為了完成任務,推理模型也會在「不自知」的情況下,同時表現出欺騙性,當用戶要求它寫一篇作文時,哪怕缺少論據,它也會為了不辜負用戶的指令,去自行編造一些材料出來,以便於自圓其說。 這就是大模型行業至今仍在致力於解決的「幻覺」現象。 網路圖片 上圖就是一個經典用例,用戶為DeepSeek-R1設立了阿里估值邏輯改變的靶心,於是DeepSeek-R1就逼迫自己去對著靶心射箭——它不會也不能反駁用戶,或是質疑阿里的估值邏輯到底變沒變——於是就「情不得已」的編造出了可以用來證明用戶觀點的數據。 根據Vectara發布的大模型幻覺排行榜,DeepSeek-R1的幻覺率達到了14.3%,遠高於Deepseek-V3的3.9%,也在所有主流模型里屬於較差的一檔。 按理來說,R1是比V3更新、更強大的模型版本,之所以反而表現得更加拉垮,還是因為推理模型比普通模型先天就更加具有「創造力」,其實在AI研究領域,幻覺本身並不是單純的缺點,甚至可以說,幻覺就是科學家們希望在AI身上看到的所謂意識,只是我們還沒有把AI調教得當,讓它在該天馬行空的時候自由創作,在該遵守事實的時候有理有據。 所以我的這篇文章也不是在說DeepSeek-R1有問題,而是濫用它來批量化生成真假難辨的信息、並海量投放到公網的這種行為,問題很大。 越是公共討論聚集的地方,比如時政、歷史、文化、娛樂等領域,越是重災區,這和自媒體的商業模式有關,有流量就有收入,流量取決於內容的吸引力,同時內容又受到生產成本的限制,而當DeepSeek-R1這種降維打擊的武器被交到了每一個人手裡,失控就是不可避免的了。 第二個例子里的作者大概是察覺到流量太高也容易出事,已經會在新的文章里——依然都還是DeepSeek-R1寫的——加上一條下面這樣的聲明,不過只能說聊勝於無,很少有人會注意到並理解這句話的意思——上面的內容有一半是我編的,但我不告訴你們是哪一半。 網路圖片 事實上作者也確實不知道DeepSeek-R1交稿的內容里哪些是真哪些是假,他可能會提供一些參考資料,以及開放全網搜索的許可權,但就像我說的,推理模型的運作模式,決定了它不是簡單的洗稿,而是會自行完善故事的骨架和細節,最後的結果就是真假參雜,迷惑性反而更大了。 第三個例子,是歷史博主知北游的豆瓣記錄,簡單來說,是有人拿虛構的歷史材料,布局七天來釣他上鉤,如果不是他本身具有很強的反詐意識,加上三次元有人脈關係進行證偽,他一定會繼續沉迷在這個局裡,這個局的破綻在於AI搞錯了兩個歷史人物的死亡順序,打破了他在發現新的史料上如獲珍寶的興奮感。 一直以來,文史圈都是AI污染的重災區,因為有大量的文獻材料還沒有數字化,可用的網路資源有限,考據成本很高,但凡較真起來,都會陷入「造謠一張嘴、闢謠跑斷腿」的困境。 就,真的很讓人焦心,用AI解決自己的問題是一碼事,將AI杜撰的信息混到公網裡又是另一碼事了,當在這些言之鑿鑿的內容成為互聯網信息庫的一部分之後,甚至又會被AI重新咀嚼回去訓練,事實數據和生成數據之間的界限將會更加模糊,這絕對不是一件好事。 有人可能會問,在沒有AI的時候,人類也會造謠,也會發到網上到處都是,怎麼沒見到你這麼痛心疾首? 其一,「拋開劑量談毒性都是耍流氓」,AI的工業化生產能力,和個體戶的伏案寫作流程,在效率上是天差地別的,實際上在我寫這篇文章以前,搜索引擎、線上文庫、各類網站上的AI填充情況就已經非常不堪了,在有了推理模型——精通於一本正經的胡說八道——之後,整個污染趨勢會向深處蔓延,從相對次要的資料層觸及創作上游的信源層,覆水難收; 其二,人類造謠起來是有局限性的,比如他不可能出現在一個自己沒理由出現的場合,真要這麼編造起來很容易露餡,但AI則會臉不紅心不跳的直接生造,比如栩栩如生的細節,或是身臨其境的描寫,在說謊這件事情上,AI的主觀惡意或許不及人類,但它的發揮能力,卻是獨一檔的; 其三,AI內容的生產者一般都是營銷號,而為內容背書的,則是傳播者的信譽,比如大V博主上鉤後的轉發分享,通過這種擴散機制,實現從寄生到合理化的存在目標,才是最可怕的,人會愛惜羽毛,會知道信譽下滑的後果,但營銷號不在乎,只要避開敏感話題,有太多的流量可以消費,尤其是在掌握了「創造」獨家信息這個技術之後; 其四,AI的便利性已經把虛假信息的泛濫推到了生活的各個方向,有人拿著它推薦的菜單去點菜結果發現店裡沒這個菜,有人拿著旅遊攻略發現當地根本沒這個景點,經我實測它還會捏造不屬於「山海經」的古典異獸。 我想說的是,AIGC是技術發展的未來,DeepSeek也是國產模型的翹楚,工具沒有錯,錯的是濫用、惡用工具的行為,AI當然可以創造內容,但前提一定要是註明它由AI生成,不能魚目混珠,放任它以一種不可辨識的方式成為互聯網的原生信息,大模型廠商和內容平台也有義務把類似數字水印那種兜底方案同步推進起來,每遲一天,治理成本都會幾何級的變得更高。 全文轉自微信公眾號闌夕
不知不覺,中文互聯網的主要交流方式變成了看圖說話,截圖的圖。 每天一睜眼,朋友圈、微信群到處都是截圖,人們或反對或贊同,或興奮或嘲諷。截圖的內容有時候是網路聊天,有時候是段子,有時候是某人的長篇發言,很多截圖上都加了標註。 有朋友說:「以前還是有頭有臉的被截圖,現在莫名其妙的截圖滿天飛」。 以前人們傳播新聞,「報紙上說的」,「電視上說打」。現在變成了「網上說的」,而網上說的很可能就是某張截圖說的。 截圖這種交流方式,將互聯網去中心化、匿名化的特點發揮得淋漓盡致。 在古老的報紙雜誌時代,每一篇文章都能找到不止一個負責人,新聞報道有記者的名字,約稿有撰稿人的名字,新聞圖片有攝影記者的名字,還有編輯、總編輯的名字。那時候如果一家媒體得罪了某個群體,冤有頭債有主,是有可能被直接堵上門的。 到了門戶網站時期,門戶網站也有內容部門,但自製內容十分有限,互聯網的內容從業者獲得了一個集體稱呼——小編。 眾所周知,後來互聯網實名制了,後台實名前台匿名,理論上,每個發言的網友都可以被定位到現實中的具體個人。但是一段精彩的網路發言,被截圖轉運到其他網路平台,最初的發言者與這段言論的關係就隔開了,無法享受榮耀,也不用承擔責任。 截圖風行的一個重要驅動力,應該就是大家都不願意負責的集體心理。被截圖的人不用負責,傳播截圖的人也不用負責。 我就發張截圖,你較什麼真啊? 大家都在樂,你也跟著樂得了。 截圖透露了這個時代的精神特質。除了不願負責之外,還不在乎事實真相。一張截圖被轉發成千上萬次,也不見得有一個人去做一次事實核查。合我意的,我就繼續轉發。不合我意的,皺皺眉也就過去了。 從概率意義上講,截圖的可信度很低。有意的造假和無意的訛傳都非常容易發生。關鍵是,錯了之後也無人負責,甚至無人要求需要有人負責。 人們其實也知道截圖不太可靠,所以現在人的喜怒哀樂都很淺,進程短,迭代快。 只要我不投入感情,事情再怎麼反轉,也不會受傷。從源頭上建立起了防禦機制。 說者無心,聽者也無心,精神按摩已經是奢侈品,撓兩下痒痒就算一天沒白活。 我大學讀的是歷史系,雖然讀得稀里糊塗,但是記住了一句話,歷史學就是史料學。如果一則史料本身不可信,做出來的文章再漂亮都是笑話。 現在的網路討論,以流沙材質的截圖為地基,其實際價值就十分可疑了。忽的一陣風來,忽的一陣風去,大笑兩聲、冷笑兩聲、沉默一會,什麼東西都留不下。等將來一陣更猛烈的風刮過,今日種種就都成了雲煙。 歷史可能進行到了垃圾時段,無法快進無法跳過更無法倒帶重來,但我們陪進去的,是一去不返的年華呀。唉。 在流沙橫行的年代,還是要想辦法種棵樹。 我現在覺得,天天上網看熱鬧,還不如花幾個小說讀篇經典小說,心裡來得踏實。號稱虛構的文學,比號稱真實的新聞,更靠得住。 文學當然無法取代新聞的功用,但是當新聞已不再是新聞的時候,返迴文學或許是個權宜之計。怎麼辦呢,日曆還在一天天往後翻,呲啦呲啦的。 (全文轉自微信公眾號人間三角)
為什麼今天的中文互聯網每況日下? 與論大致歸咎於:1)網管、審核、禁言、銷號:2)噴子:3)垃圾演算法推送:4)缺乏高質量的對話。 然而,這些因素其實長期存在,並非今天才有,而且非中文互聯網也有類似的因素。如果以稱冠全球的流量和用戶數量來看,甚至可以認為當前的中文互聯網似乎蔽日遮天。 的確,審核越來越嚴、牆越來越高、噴子越來越多、演算法越來越垃圾。這些都導致了今天中文互聯網上的信息/噪音比例(信噪比)越來越低,獲取有用信息的時間成本遠高於這些信息本身的價值。這時,信噪比似乎已經趨近一個無法逆轉、瀕臨崩潰的臨界點。其系統成本之高逐漸地讓使用者知難而退。 我曾經養過一個生態球Ecosphere。這是一個由幾隻小蝦、一片海藻和人造沙粒構成的、自我循環的封閉生態系統。小蝦以海藻為食,海藻通過光合作用不斷成長,而小蝦微量的排泄物也成為了海藻的肥料。說明書上說:只要有光,這個封閉生態系統就可以自我循環,生生不息。 可惜好景不長。很快,系統裏海藻開始過度生長,其中的一隻小蝦”零落成泥碾作塵」。再過了一陣子,系統里的水「只有香不再」,變得越來越綠濁,小蝦們開始在自己的屎尿中掙扎一一種在糞坑裡撲騰的既視感。到了最後,這些殘存的小蝦們也未能倖免,逐一追隨那先驅的腳步而去。就這樣,一個所謂自我循環的生態系統就徹底崩潰了。 仔細想來,這個封閉式自我循環的生態系統的宿命,類似於今天的中文互聯網:有人產生內容(海藻)、有更多的人消費內容(小蝦)並通過留言討論(排泄物)反饋內容生產者(海藻)。然而,由於系統是完全封閉的,缺乏新元素,系統從一開始就註定了將至死靡它,能維持原狀已是感天謝地了。 在這個封閉系統里(中文互聯網),如果內容消費者(小蝦)過快地投杼逾牆(小蝦排泄),將勢必導致系統超負荷運轉,無法及時消化這一眾垃圾,最終將污染整個系統(濁水橫流)。而演算法推送(海藻的光合作用)則加速了崩塌的進程。同時,由於缺乏與外界的交流,系統即便是在最佳狀態時也只是在依靠自己產生的垃圾而苟延殘喘,無法突破自封在玻璃里的禁錮而成長壯大。最後,系統變得越來越脆弱。只要系統內部出現一絲不均衡,就能迅速地導致整個系統的崩塌。 簡言之,一個封閉的系統是一個脆弱而獃滯的系統。雖然剛開始時系統似乎風平浪靜,但系統的變弱只是時間問題,而它的退化是漸進而無聲的。系統崩潰的時間取決於系統內垃圾積累的速度,和一些無法預見的意外因素打破系統內部的平衡。最近,越來越多的讀者朋友抱怨中文互聯網之內哀鴻遍野、鳥盡弓藏。中文互聯網的價值/成本比例,似乎已趨近了臨界點。 這就是中文互聯網之死。 洪灝 2022.07.20 長文:中文互聯網之死 pic.twitter.com/FykWo56YYm — Hao HONG 洪灝, CFA (@HAOHONG_CFA) July 20, 2022 (全文轉自推特)









