類別

AI工具

DeepSeek的胡編亂造,正在淹沒中文互聯網

雖然DeepSeek-R1確實好用,但它在爆火之後,成了人手一個的AI工具,也對中文互聯網的信息環境造成了嚴重的污染情況,這是一個固然難以避免但也理應得到重視的問題。 最近一個星期以來,就我看到的刷屏文章,至少有三例都是DeepSeek-R1生成出來的、充滿了事實錯誤的內容,卻因其以假亂真的迷惑性,讓很多朋友信以為真,情緒激動的分享傳播。 第一例,是知乎的這條高贊回答: 網路圖片 即使在我指出來之後,依然有人不可置信的表示,看不出來其中的「AI味」,所謂的「AI味」,指的是DeepSeek-R1創作文本時特有的「極繁主義」,比如生造概念、堆疊名詞、濫用修辭等等。 而這條知乎回答,或因提示詞喂得好,或因後期潤色得力,在很大程度上消除了它的「AI味」,但從表達結構上,經常和AI打交道的用戶都能一眼看出痕迹,純正的DeepSeek-R1風格,當然普通人確實難以識別。 不過我也不是直接得到這個結論的,在看到朋友分享這條回答時,我原本也和他一樣,是帶著對於國產動畫電影崛起的興奮全盤接受了如此言之有物的論證,直到一個致命的紕漏讓我察覺到了不對勁。 作者說哪吒電影里的敖丙變身鏡頭在法國昂西動畫節上轟動業界,問題是,法國是有一個昂西動畫節,哪吒的電影也是送去參展過,但那是追光動畫出品的「哪吒重生」,而不是餃子導演的「哪吒」…… 而且因為審核原因,這部送展的「哪吒重生」宣傳片實際上是一部品牌概念片,內容是在一個現代都市裡的賽車動作演示,哪吒根本就沒出現,更不存在敖丙的變身…… 網路圖片 繼續查證也能發現,關於「哪吒」的製片方給員工分成都房子、攻克水下流體特效之類的描述,全都是DeepSeek-R1為了完成這篇命題作文自己腦補的。 第二個例子,就更離譜了,離譜到我不太能把完整截圖發在這裡,因為有些膽子夠粗的自媒體,已經在拿DeepSeek去寫涉軍涉政的東西了。 其中有一篇寫軍工打虎譚瑞松的選題,標題是《軍工虎譚瑞松, 從「道德標兵」到「獵艷狂魔」,「國之重器」淪為私人金庫》,原文現在已經被刪了,應該是被被轉得太廣作者害怕了,但很多「金句」的截圖還在到處傳,什麼直升機的設計圖紙在暗網裡開價200比特幣出售、收受金條賄賂時要求熔成發動機葉片形狀、某總師離職時留言這裡不是造飛機的地方而是造孽的工廠等等,如果你能記得這些細節,就一定知道我說的是哪篇文章。 不好意思,這也全都是DeepSeek-R1自己編的。 為什麼我能確信是DeepSeek-R1的手筆呢?為什麼不能是ChatGPT、Claude、文心一言?因為DeepSeek-R1是當前唯一能用的免費推理模型,且對中文的支持度足夠高,這本來是DeepSeek-R1的優勢,只是沒被用在正道上。 此時就需要補充一個推理模型的特點了,那就是推理模型的訓練過程特別注重獎懲機制,通過思維鏈的暴露我們也能看出它通常都會想得縝密、生怕自己沒有摸清用戶意圖,以致於經常到了「諂媚」的程度。 這種訓練模式的好處在於,可以讓推理模型擁有舉一反三的能力,能夠更加靈活和完善的去完成任務,但是相對的,為了完成任務,推理模型也會在「不自知」的情況下,同時表現出欺騙性,當用戶要求它寫一篇作文時,哪怕缺少論據,它也會為了不辜負用戶的指令,去自行編造一些材料出來,以便於自圓其說。 這就是大模型行業至今仍在致力於解決的「幻覺」現象。 網路圖片 上圖就是一個經典用例,用戶為DeepSeek-R1設立了阿里估值邏輯改變的靶心,於是DeepSeek-R1就逼迫自己去對著靶心射箭——它不會也不能反駁用戶,或是質疑阿里的估值邏輯到底變沒變——於是就「情不得已」的編造出了可以用來證明用戶觀點的數據。 根據Vectara發布的大模型幻覺排行榜,DeepSeek-R1的幻覺率達到了14.3%,遠高於Deepseek-V3的3.9%,也在所有主流模型里屬於較差的一檔。 按理來說,R1是比V3更新、更強大的模型版本,之所以反而表現得更加拉垮,還是因為推理模型比普通模型先天就更加具有「創造力」,其實在AI研究領域,幻覺本身並不是單純的缺點,甚至可以說,幻覺就是科學家們希望在AI身上看到的所謂意識,只是我們還沒有把AI調教得當,讓它在該天馬行空的時候自由創作,在該遵守事實的時候有理有據。 所以我的這篇文章也不是在說DeepSeek-R1有問題,而是濫用它來批量化生成真假難辨的信息、並海量投放到公網的這種行為,問題很大。 越是公共討論聚集的地方,比如時政、歷史、文化、娛樂等領域,越是重災區,這和自媒體的商業模式有關,有流量就有收入,流量取決於內容的吸引力,同時內容又受到生產成本的限制,而當DeepSeek-R1這種降維打擊的武器被交到了每一個人手裡,失控就是不可避免的了。 第二個例子里的作者大概是察覺到流量太高也容易出事,已經會在新的文章里——依然都還是DeepSeek-R1寫的——加上一條下面這樣的聲明,不過只能說聊勝於無,很少有人會注意到並理解這句話的意思——上面的內容有一半是我編的,但我不告訴你們是哪一半。 網路圖片 事實上作者也確實不知道DeepSeek-R1交稿的內容里哪些是真哪些是假,他可能會提供一些參考資料,以及開放全網搜索的許可權,但就像我說的,推理模型的運作模式,決定了它不是簡單的洗稿,而是會自行完善故事的骨架和細節,最後的結果就是真假參雜,迷惑性反而更大了。 第三個例子,是歷史博主知北游的豆瓣記錄,簡單來說,是有人拿虛構的歷史材料,布局七天來釣他上鉤,如果不是他本身具有很強的反詐意識,加上三次元有人脈關係進行證偽,他一定會繼續沉迷在這個局裡,這個局的破綻在於AI搞錯了兩個歷史人物的死亡順序,打破了他在發現新的史料上如獲珍寶的興奮感。 一直以來,文史圈都是AI污染的重災區,因為有大量的文獻材料還沒有數字化,可用的網路資源有限,考據成本很高,但凡較真起來,都會陷入「造謠一張嘴、闢謠跑斷腿」的困境。 就,真的很讓人焦心,用AI解決自己的問題是一碼事,將AI杜撰的信息混到公網裡又是另一碼事了,當在這些言之鑿鑿的內容成為互聯網信息庫的一部分之後,甚至又會被AI重新咀嚼回去訓練,事實數據和生成數據之間的界限將會更加模糊,這絕對不是一件好事。 有人可能會問,在沒有AI的時候,人類也會造謠,也會發到網上到處都是,怎麼沒見到你這麼痛心疾首? 其一,「拋開劑量談毒性都是耍流氓」,AI的工業化生產能力,和個體戶的伏案寫作流程,在效率上是天差地別的,實際上在我寫這篇文章以前,搜索引擎、線上文庫、各類網站上的AI填充情況就已經非常不堪了,在有了推理模型——精通於一本正經的胡說八道——之後,整個污染趨勢會向深處蔓延,從相對次要的資料層觸及創作上游的信源層,覆水難收; 其二,人類造謠起來是有局限性的,比如他不可能出現在一個自己沒理由出現的場合,真要這麼編造起來很容易露餡,但AI則會臉不紅心不跳的直接生造,比如栩栩如生的細節,或是身臨其境的描寫,在說謊這件事情上,AI的主觀惡意或許不及人類,但它的發揮能力,卻是獨一檔的; 其三,AI內容的生產者一般都是營銷號,而為內容背書的,則是傳播者的信譽,比如大V博主上鉤後的轉發分享,通過這種擴散機制,實現從寄生到合理化的存在目標,才是最可怕的,人會愛惜羽毛,會知道信譽下滑的後果,但營銷號不在乎,只要避開敏感話題,有太多的流量可以消費,尤其是在掌握了「創造」獨家信息這個技術之後; 其四,AI的便利性已經把虛假信息的泛濫推到了生活的各個方向,有人拿著它推薦的菜單去點菜結果發現店裡沒這個菜,有人拿著旅遊攻略發現當地根本沒這個景點,經我實測它還會捏造不屬於「山海經」的古典異獸。 我想說的是,AIGC是技術發展的未來,DeepSeek也是國產模型的翹楚,工具沒有錯,錯的是濫用、惡用工具的行為,AI當然可以創造內容,但前提一定要是註明它由AI生成,不能魚目混珠,放任它以一種不可辨識的方式成為互聯網的原生信息,大模型廠商和內容平台也有義務把類似數字水印那種兜底方案同步推進起來,每遲一天,治理成本都會幾何級的變得更高。 全文轉自微信公眾號闌夕

我是中國人,我很想用Sora

一個大家早就當作社會現實,但很多人並不知道真實原因的現象: 正在引領全球變革的AI工具,我們一個都用不了。 OpenAI的ChatGPT,用不了; 微軟的Copilot,用不了; 谷歌的Bard,用不了; 用AI繪畫的Midjourney,也用不了。 剛開始內測還沒正式開放的,用AI生成視頻的Sora,我們肯定也用不了。是的,我非常確定,我們肯定用不了。 對的,還沒上市呢,我就知道肯定用不了,而且沒有任何人會對這個結果感到意外。我們只是遠遠地看一眼就能知道,這玩意兒肯定不會給我們用。 那麼問題來了,為什麼我們用不上這些AI工具呢? 最直接的答案,當然是開發這些AI工具的公司不讓中國大陸用戶使用。以上我提及的這些AI工具,目前全部都禁止中國大陸用戶註冊使用。當然,它們的說法不是禁止,而是目前尚未開放該區域服務。 那,為什麼呢? 是中國用戶消費不起嗎?這顯然不可能。 以蘋果手機為例,每年發布的高端機型在中國賣得那叫一個遙遙領先。這些AI工具一年幾百塊的使用費,不存在消費不起。 是擔心中國盜版多嗎?顯然也不是。 以上這些AI工具目前提供的都是實時訪問入口,而不是桌面時代的『軟體』,不存在你盜版複製一份就能拿去賣錢的可能性,也不存在源代碼被抄襲的可能性。 是為了打壓中國的AI產業故意不給中國人用嗎? 有些人從晶元領域『卡脖子』聯想到這種可能性,會不會是美國政府給這些企業下了命令,不讓它們給中國用戶提供服務呢?這也不是事實。 首先,美國政府當前並沒有出台法令禁止科技公司向中國市場提供AI服務,這些公司不可能自己層層加碼放棄中國市場。實際上,即便是在晶元領域,相關公司也是一直在與美國聯邦政府角力,希望政府取消對中國市場的出口禁令。 美國政府出台了限制法令,企業當然需要遵守,但政府沒有出台明文法令的時候,是不可能通過『打招呼』『發通知』或者『私下要求』等方式干涉企業經營的。明面上沒有禁止,就是沒有禁止,不需要去盲猜。 然後,即便美國政府在將來某一天出台AI領域針對中國的限制令,那也只會限制面向公司用戶的『技術出口』,而不可能限制面向個人用戶的『產品出口』。 以晶元領域為例,按照美國當前的限制法令,一家中國公司想訂購蘋果手機同款的最新晶元用來生產香蕉手機,那是做不到的。但是作為個人用戶,我們卻能和全球用戶同步買到蘋果的最新款手機,裡面也包含了一顆技術先進的蘋果晶元。這就是區別所在,前者是公司用戶,購買的是技術,後者是個人用戶,購買的是產品。 美國將來有可能會限制AI技術的出口來打壓中國,但不可能限制AI公司向中國個人用戶提供賺錢的服務,那是無意義的自廢武功。美國可能不友好,但人家絕對不蠢。 排除了上述可能性之後,我們大致能猜到,中國大陸用戶用不了這些AI工具的原因,歸根結底還是美國公司能力不行。 按照中國的法規,互聯網公司面向公眾提供AI服務以及信息服務之前,需要事先向有關部門提出申請,滿足相關條件後才可以上線服務。這裡的條件,最主要的就是安全,各種層面的安全可控。 很顯然,OpenAI、谷歌、微軟,都沒有能力滿足中國監管機構提出的安全要求,所以它們沒有辦法合法地進入中國市場運營。為了避免尷尬,我就不討論它們有沒有興趣滿足這些要求了。 所以,上述公司為了避免在中國市場非法運營,就主動關閉了面向中國大陸用戶的服務。 生物學上有一個概念叫『生殖隔離』: 原本是同一個物種的動物,因為地殼運動被分隔在了不同的大陸板塊,最終走上了不同的演化道路。一定時間之後,原本同出一源的後代逐漸產生了生殖隔離,變成了不同物種。 文章來源微信公眾號:基本常識

編輯推薦