ChatGPT、Midjourney AI工具入門懶人包-從實作經驗談入門
2023 Mar 04 在日本讀小學 AI人工智慧
《AI工具快速理解懶人包-實作篇》
我研究所的時候有小小研究過類神經網路(還去了美國發表論文,現在覺得有點不可思議),所以一直有在關注AI 的發展,我那個年代AI 有點雷聲大雨點小,好像發展的速度很慢一直找不到突破點,但近年可能是運算力突然大幅增長,原本算不出來(或要算到天荒地老)的都算的出來了,原本要一直優化速度的演算法也不需要浪費時間在糾結速度了,反覆驗證所需的時間也大幅縮短,所以AI 突然開始快速發展,更有人說chatGPT 的出現是一個奇點的來臨。
理論就不多說,我想分享一下最近亂摸各種AI 工具的小小懶人包,希望可以協助想要快速進入狀況的朋友節省一些時間和焦慮感。(還有聊天的時候多一個話題囉)
註:這篇文章中的的可愛妹妹們就是我用Midjourney詠唱出來的~
ChatGPT
首先是ChatGPT。你問他的資料要有在模型中才會有答案,他沒有答案(他自己其實不知道)但覺得可以近似拼湊的,也會自己腦補,所以開放式的問題常常正確性不高。例如問他自己的名字是誰,他會講的頭頭是道,但是是錯的。
同理,在很多事實性的問答上面ChatGPT 的準確度其實很低,這點還是需要人類去專業判斷。
ChatGPT能寫偽新聞,但不會寫新聞
另外目前的模型資料只到2021,並非即時更新,所以目前他無法寫新聞。實測改寫新聞的功力也很弱,因為它會有一個自動腦補的傾向(我認為是因為GPT是用預測下一個字的方式生成,新聞句子有其不可用機率預測的特性,但很可惜(還是該說很幸運)GPT使用的是有機率的算法),他會自己亂改數字,或者把不相干的內容自己加進去。但看起來還是頭頭是道就是了。現階段他無法取代記者編輯,但是很簡單就能產出偽新聞。
ChatGPT很適合產出大綱
但是chatgpt很適合拿來做大綱、初期靈感這種沒有對錯的輔助工具。例如,「我想寫一篇5萬字的小說,主角是女性,講述她重啟人生的故事,內容要有科幻、懸疑,溫馨和勸世。請給我小說的大綱。」這種沒有標準答案的創作,chatGPT 能夠提供很多靈感,如果不滿意可以再就不滿意的部分要他修改。有了大綱,可以再請他把肉給長出來,如此就能真正完成一本小說。但是我必須說,可能受限於模型,寫出來的小說是還算中規中矩,但是並沒有到好看的程度。所以現階段我認為作家們也可以先不用擔心,沒靈感的時候可以問問他,但單靠
ChatGPT自己寫不出好東西。
但是用它作為「輔助工具」是可以產出非常好的知識性內容喔,這個我已經在實作了。
ChatGPT很適合產出提案或文案
再例如,「幫我寫一個xx商業提案」「幫我寫一段xx商品行銷文案」「致詞講稿」,這種沒有對錯的他也能夠寫得頭頭是道,但是專業人士一眼就能看出內容是空洞的,是用一堆專業詞藻堆積出來的沒有靈魂的內容,拿來交作業遇到有實務經驗的老師會被打不及格分的那種。但是拿來輔助寫標案或補助案,應該可以省去很多想大綱的時間。
另外一個他擅長的是摘要和翻譯「現存的文章」。最便利的方式就是丟一篇原文文章,請他翻譯並直接摘出重點,在這個點上能夠節省不少時間。但是我實測他還是會有準確性的問題,就像翻譯軟體目前也無法100%正確,所以重要的文件還是得找專業的。
ChatGPT不會算數學
ChatGPT 不是運算器,他是「語言」模型,所以他不會算數學喔,他的數學是用語言模型硬算出來的,所以他數學不好,請不要問他數學問題。
ChatGPT能寫簡單和常見的程式,但稍微複雜就不行了
不過ChatGPT似乎很會寫程式(我看朋友們分享的),可能跟他的模型有關,我實測一直很想做的程式交易,顯然他的模型中有很多常用的程式片段,但是要讓他照我的特殊邏輯寫反而不行,他會一直腦補常見的交易程式片段進來API文件也沒真的進去看,唬我!(我整個實測詳細過程請見這一篇 AI能夠取代程式設計師嗎?實測結果揭曉 )
ChatGPT不會講笑話
補充一下,ChatGPT沒有幽默感,它非常不會講笑話,他的笑點一點都不好笑。
Line版的ChatGPT
最近有日本公司把Line 串了ChatGPT,在Line 搜尋ChatGPT即可,他叫「AIチャットくん(ChatGPT)」,我有買premium ,一個月680日幣,比原網頁版的快又好用,不用登入也不會容易error。
Midjourney-繪圖類AI
再來講講Midjourny這類繪圖AI。它的最大門檻應該只在一開始怎麼進入。Midjourny 是discord 裡面的一個對話機器人,所以要先安裝discord 。(它是一個社群軟體,裡面可以開很多聊天室,也可以和別人寫好的機器人聊天,midjourny就是很聰明的用機器人的方式接受指令和輸出)然後去裡面和midjourny 這個機器人聊天。
Stable Diffusion-繪圖類AI
Stable Diffusion 也就是最近很紅能夠產出取代小模攝影的一個軟體,他有網頁版,但是使用的模型一般般,不大容易做出很厲害的圖。要做出厲害的圖,需要安裝一些程式和需要有GPU 去跑,這邊就不詳細教學,環境安裝好之後,他真的也不難(但要注意雖然stable diffusion說可以商用,但有些模型是不允許商用的)。目前也有能在google colab雲端運行的版本,可參考這篇文章。https://www.kocpc.com.tw/archives/482754
Midjourney商用條件
Midjourny目前的條款是,成為付費用戶就可以將產出商用,如果公司年營業額超過100萬美元就必須要用pro方案(每月60美元其實也不貴)。
Midjourney會造成美術工作者的失業嗎?
Midjourny 實務上已經能夠產生非常擬真商品情境圖、可以產生文章配圖,都能夠讓不會畫圖的人(我)可以自己動手把圖畫(詠唱)出來。這部分我已經實作且實用一段時間了,效果非常好,一直改一直改機器人也不會抱怨(ChatGPT就會生悶氣...)。用產出的圖再跟設計師合作,或自己搭配canva類的軟體拉一拉,節省很多精力和成本。
但如果你要問我那美術工作者會不會失業呢?我認為會設計和擁抱AI 的人一定會有更多工作機會的。我有美術朋友早早就在用SD算圖,我說真的有深厚功力的人算出來就是跟我們這種麻瓜不一樣。
我自己的例子是,如果我沒辦法用AI自己畫圖,那我就沒辦法負擔高額的繪圖費用(也沒時間來回溝通),就不會有後續拿畫好的圖請設計師幫我加工設計成商業成品。而這也讓創業的門檻降低很多,善用各種科技工具取代傳統花錢外包或請員工也是讓我能在公司成立的第一天就開始賺錢的其中一個原因。
至於AI 音樂這個其實多年前就有了,目前網路上能線上做AI 音樂的網站很多,但我一個個進去實測,感想是雖然能做出能聽的音樂,但是不好聽。如果只是拿來當成影片配樂或效果音,調校技術好一點的話是完全沒問題,但要創作出「能紅」的音樂還是差一大截。
AI圖文生成技術- D-ID、剪映
再來就是AI 圖文生成技術,製作影片現在已經可以一鍵生成,有一鍵剪輯+語音的軟體(例如剪映下載版),不會剪輯技術的人再也不用擔心,他直接幫你照文字段落剪好,人只要進去微調。也有可以讓角色講話+語音的軟體(我之前示範過,用Midjourny畫一個主播,用chatGPT寫播報稿,再放進D-ID中,一個虛擬主播語音報新聞的影片就完成了,語音已經可以做到幾乎聽不出來是機器,不過目前人像動態還是假假的。這個播報影片成品在我的FB這篇貼文)。這些工具都已經把介面做到阿嬤也能夠簡單上手,但後續怎麼應用才是決勝的重點。
AI生成的著作權問題
至於著作權的問題,目前各國法律傾向不保障非人類生成的作品,意思就是用AI 產生的作品,其他人如果抄去用,你很難跟他求償。好幾年前有個新聞就是有人用AI 生成無數個音樂片段,想要藉此當版權蟑螂到處求償,但最後被判決無效因為那是機器生成的。
上面是關於AI 工具的小分享,我盡量講的淺顯一些,讓還沒有進來玩的朋友們可以快速先看一下概觀。
AI在產業的應用和實務困境
AI的發展絕對是超前這些to C應用很多,範圍其實也非常廣泛,如工廠的產線偵錯、精準廣告的投放、個人化內容推薦都已經發展非常多年了,但最大的問題還是在於,AI的數據或研發專家如果對產業的domain knowhow 不夠熟,很容易做出垃圾進垃圾出的結果。理論都對,但是結果就是不對。這是我和吳仕強在不同產業但是卻共同有的親身經驗。
結語
最後我有幾個感想
1. AI是工具,「使用」工具本身並沒有什麼了不起,如何讓工具產生有意義的結果或變現才是真功夫。
2. AI不會取代所有人,但是有些工作需要的人力的確會縮減,或工作範疇的變更(例如顧產線的需求變少、研發自動化偵錯的研發人員需求變多)擁抱時代的人絕對不會被淘汰。
3. 要做到以上兩點,就算不去研究演算法,至少要先去摸一摸各種AI工具,體會一下AI在生活應用上到底在幹嘛。
當然現在進步的速度突然變很快,上面的心得搞不好一兩個月後又會隨著科技進步而改變了,但這就是現在這年代最好玩的地方!!