ChatGPT的思維是甚麼? - 工程師

Regina avatar
By Regina
at 2023-02-17T08:53

Table of Contents

※ 引述《paulcaptain (我不會寫程式)》之銘言:

阿肥外商碼農阿肥啦!

剛好看到這篇文章就回覆一下,這次大型語言模型(LLM)表現出來的是語言模型的湧現能
力,我其實不贊同LeCun說的LLM是歪路,畢竟雖然我們可以直覺知道加大網路連接數可能
是實踐人類大腦的一個重要步驟(畢竟人腦的連結數量跟複雜性在生物醫學上都有驗證),
但科學上不去驗證你沒辦法證明某些事情的。

我這邊科普一下湧現(Emergent)能力是啥好了,所謂的湧現源自於生物學就是指當生物
系統夠複雜的時候,就會表現出他群集本來不具備的功能,像人類社會就是這樣的。而套
用到LM上就發現到這種狀況普遍存在大型語言模型,像LaMDA、GPT-3、Gopher這些LLM都
表現出跟人類一樣出色的類比、歸納能力甚至更出色,甚至不需要做任何直接訓練很多實
驗中都驗證只要只要夠大,自然就有湧現能力,這也驗證了為啥prompt tuning在LLM上面
才可行,因為你夠大就可以用prompt 刺激他某些激活神經元,出現本來不具備的能力(有
興趣知道prompt tuning可以去看一下chain of thought 那篇論文)。而正經瞎掰有時候
正是人類文明的特色,自然界很多物種其實是不會虛構事實跟類比的。

回到為啥他數學不好的點上,這邊其實蠻多針對chatGPT跟大型LLM的論文或是博客研究都
發現到當前LLM對於歸納推理、因果推論、空間推理都是表現蠻差的,而且大小模型也不
會因為增加參數規模而獲得更好的結果,這正好是由於其實模型現在的理解力是基於橫向
水平的,而數學、因果推論其實是空間物理樹狀的,舉例來說,你做加法或乘法的時候其
實是先去檢索過往有沒有背過相似的模板然後在去想像空間樹狀垂直相乘或相加(我自己
腦袋是比較差的,但是之前討論過大部分跟我智力水平差不多應該都是這樣,也許有人可
以趴一下橫向思考腦袋就出現計算結果,但當前不討論),這點是當前LLM不具備的,畢竟
當前基於的模型結構都是基於橫向語言優化的,也沒有物理規則的概念,所以也驗證了當
前LLM的侷限性。

至於程式語言為啥chatGPT表現優異我覺得主要還是在於,其實現代的程式語言都是封閉
自洽的,而且說其實我們人類在看程式碼是垂直樹狀佈局的,但其實思維上依然是橫向佈
局,而這種模式是跟LLM天然相似的,所以你要他實作一個功能真的相對單純,不過人類
有空間佈局的概念也看出來為啥LLM還做不到系統級的設計,你只能一個一個把他原子化
成橫向思考再來問他實作功能才是最好的。

其實我更傾向把這次LLM的實驗當作是AI/DL領域對於複雜系統的文藝復興,有了這次的實
驗後該思考的是如何解構大腦思維與神經元之間的關聯,讓機器去真正理解物理世界的規
則、建構樹狀空間的複雜語言模型,坦白說,這只是通用人工智慧(AGI)的一個開端,打
開這個複雜的盒子後才是黑暗大陸的探索。

剩下的因為太過學術的東西就不再這個版上討論了,有興趣未來可以聊,差不多先醬

--

All Comments

Oscar avatar
By Oscar
at 2023-02-18T09:09
板上同時有高水準文章好不適應xd
Andy avatar
By Andy
at 2023-02-19T09:26
強大
Irma avatar
By Irma
at 2023-02-20T09:43
推一下
Catherine avatar
By Catherine
at 2023-02-21T10:00
湧現的現象確實很耐人尋味,差500這個點是chatGPT
Zanna avatar
By Zanna
at 2023-02-22T10:17
有意為之還是真的算錯?還是真的耍俏皮?耐人尋味
Dora avatar
By Dora
at 2023-02-21T21:24
Genevieve avatar
By Genevieve
at 2023-02-22T21:41
push
William avatar
By William
at 2023-02-21T21:24
Elvira avatar
By Elvira
at 2023-02-22T21:41
好認真啊
Edith avatar
By Edith
at 2023-02-21T21:24
一堆不太相干的名詞 其實什麼都沒解釋到
Daph Bay avatar
By Daph Bay
at 2023-02-22T21:41
很像ChatGPT 的回答
Daph Bay avatar
By Daph Bay
at 2023-02-21T21:24
你講的沒錯
Tom avatar
By Tom
at 2023-02-22T21:41
湧現這個現象確實很有趣 但目前缺乏證據跟因果關係
Liam avatar
By Liam
at 2023-02-21T21:24
不錯的觀點,目前LLM百花齊放,未來期待有更多的研
Tracy avatar
By Tracy
at 2023-02-22T21:41
有趣的文,推推
Rebecca avatar
By Rebecca
at 2023-02-21T21:24
推 大力出奇蹟確實是很有意思的觀察
Odelette avatar
By Odelette
at 2023-02-22T21:41
Self attention 要怎麼讀才能瞭解?
Anthony avatar
By Anthony
at 2023-02-21T21:24
AGI才正要開始,蠻多學校要開始弄了
Heather avatar
By Heather
at 2023-02-22T21:41
外行人瞎扯路)亂說,順便算大神LeCun,結果還有人推
Todd Johnson avatar
By Todd Johnson
at 2023-02-21T21:24
。 02/17 17:18
Hamiltion avatar
By Hamiltion
at 2023-02-22T21:41
真的是越外行越愛酸真正懂AI 的人耶
Delia avatar
By Delia
at 2023-02-21T21:24
你先去看那篇論文的 Emergent ability是怎麼定義的
Yedda avatar
By Yedda
at 2023-02-22T21:41
,跟你解釋瞎扯的完全不同。
Yuri avatar
By Yuri
at 2023-02-21T21:24
那篇論文是模型大到一定程度說loss的突然降低,沒說
Lucy avatar
By Lucy
at 2023-02-22T21:41
會出現本來不具備的能力喔。
Elvira avatar
By Elvira
at 2023-02-21T21:24
https://arxiv.org/pdf/2206.07682.pdf
Puput avatar
By Puput
at 2023-02-22T21:41
An ability is emergent if it is not present in
Cara avatar
By Cara
at 2023-02-21T21:24
smaller models but is present in larger models.
Agatha avatar
By Agatha
at 2023-02-22T21:41
生出合格的語言/程式碼和生出合格的數學式本來就不
是同一件事
Donna avatar
By Donna
at 2023-02-21T21:24
1+1=3是合格的語言/程式碼 回傳為False
Kristin avatar
By Kristin
at 2023-02-22T21:41
所以 重點更在於在不同脈絡下 人類感覺"厲害"的標
準不一樣了 自己卻沒意識到
Leila avatar
By Leila
at 2023-02-21T21:24
你對數學式做再多樹狀分析 也找不到使數學式為真的
Liam avatar
By Liam
at 2023-02-22T21:41
規則 因為那是semantics不是syntax
Carol avatar
By Carol
at 2023-02-21T21:24
湧現這種現象本來就很符合現實 現實中很多複雜的東
西其基礎構造都很簡單 比如說邏輯閘最後變成CPU GPU
量大到一定程度 量變產生質變
Isabella avatar
By Isabella
at 2023-02-22T21:41
板上同時有高水準文章好不適應xd
Valerie avatar
By Valerie
at 2023-02-21T21:24
不應該說不具備,而是還沒發掘而已
Freda avatar
By Freda
at 2023-02-22T21:41
覺得台灣這領域的教授可以減薪了。
Donna avatar
By Donna
at 2023-02-21T21:24
推推
Harry avatar
By Harry
at 2023-02-22T21:41
看不懂嗚嗚

科技業掀 CEO 降薪潮!彭博社揭真相「根

Kama avatar
By Kama
at 2023-02-17T04:53
科技業掀 CEO 降薪潮!彭博社揭真相「根本不痛不癢」 https://technews.tw/2023/02/16/tech-ceo-salary-cuts/ 作者 林 妤柔 | 發布日期 2023 年 02 月 16 日 12:11 | 分類 人力資源 , 公司治理 , 財經 https://i.im ...

美光這波操作,被裁的似乎較爽

Catherine avatar
By Catherine
at 2023-02-17T00:59
剛工作沒幾年 沒老婆沒小孩沒房貸 一人吃飽全家飽 領了一大筆錢又放假 你當然會覺得很爽 又或者你一被裁 下份工作就有著落 那你也可以很爽 如果你每個月固定支出個七八萬 又兩三個月沒找到工作 看到銀行存款只會減少不會增加 你絕對爽不起來 - ...

美光這波操作,被裁的似乎較爽

Annie avatar
By Annie
at 2023-02-16T23:57
美光這波操作,被裁的似乎較爽! 留下來的,沒獎金...還要上班做事 被裁的放假去,還可以拿百萬資遣費去玩樂 留下來的員工在想什麼? 繼續當奴才上班......!? - ...

華邦電去年第4季每股純益0.14元 創2年新

Zora avatar
By Zora
at 2023-02-16T23:46
新聞標題: 華邦電去年第4季每股純益0.14元 創2年新低 2023/02/16 18:37:32 中央社 記者張建中新竹16日電 記憶體廠華邦電去年第4季歸屬母公司淨利新台幣5.46億元,季減近8成,創2年新低,每 股純益0.14元。 受消費及網通市場需求低迷影響,華邦電去年第4季營收19 ...

offer 請益

Linda avatar
By Linda
at 2023-02-16T22:40
先介紹一下我的背景 非本科私立大學畢業,相關的工作大約10年左右 之前的職位基本都是系統維運工程師(OP) 語言證照:TOEIC 645; JLPT N2 之前面了很多輪之後終於有自己投遞的工作拿到offer的情況, 但是因為兩間公司規模都不大,上網搜尋的資訊太過稀少, 加上不知道裡面的風氣如何因此想來板上詢 ...