Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
運用 AI,一起變強
運用 AI,一起變強
2022 年 ChatGPT、Midjourney 這兩項圍繞著 AI 技術所發展的產品應該是許多人開始切身體會到 AI 會對我們的生活、工作帶來革命性改變的開端。
ChatGPT、Midjourney 背後所運用的 AI 概念稱為生成式 AI(Generative AI),簡單來說就是讓機器透過學習,試著創造出一些全新的創作,包括像是文字、圖像、影像、聲音等各類型的創作,例如寫作一段文字、生成一張 AI 合成的照片、生成一個實際上不存在的大頭照(搭配廣告素材大量應用、節省請模特兒的費用)、產生一段沒有版權問題的音樂等。
近些年來無論在學術領域或產業界,深度學習(Deep learning)或是 GANs 生成對抗網路(Generative Adversarial Networks)都為人類社會帶來了許多想像空間與衝擊,光是 ChatGPT 或是 Midjourney 並不足以真正改變產業或許多公司習以為常的工作流程與個人的工作習慣,更重要的是 AI 技術的日漸成熟,潛移默化的改變。
舉例來說,我們以一個上班族或是一人公司等追求「個人生產力極大化」的工作環境,過去想要一個打十個的方法主要是選用一些好用的工具(SaaS 工具或是各種軟體),讓各種工作流程可以更加流暢並且自動化,善用各種工具可以減少外包的需求、減少聘僱員工的固定費用,通常是取代一些較為機械式、重複性的工作,像是寄信、寄出商品、授權設定等等。
而 AI 所能帶來最大的轉變,我相信也是多數人在 ChatGPT 以及 Midjourney 所感受到的驚人創造力,我們彷彿開始可以想像原來 AI 可以開始理解對話、歸納資訊、並且進行基礎的判斷,我們對 AI、網路、軟體所能帶來的生產力,顛覆了過去的認知。
在人工智慧還沒真正到來的時代,我們總開玩笑說「現在還是工人智慧的時代」,如今,人工智慧的時代來臨了,工人們如何善用自己的智慧,與人工智慧並存、一起變強,顯然會是接下來幾年最重要的任務了。
閱讀本文時,建議一邊可以思考幾件事:
本文目錄
長期來說,我們很難預測人工智慧將會為人類社會帶來的各種正面、負面的影響,無論你是樂觀或悲觀主義者,我都鼓勵你學習與人工智慧共存,運用人工智慧所帶來的生產力提升,探索關於自身未來的更多可能性,像是更便利的生活或是更輕鬆、更高產出的工作,並且善用人工智慧讓自己變得更強、更能適應未來。
目前,圍繞在工作場景需求的人工智慧應用已經進入了成熟、可用的階段,有些產品每個月的租金乍看之下實在不便宜,每個月的費用可能是 US$99 起跳,如果要同時搭配三五套 AI 產品交互運用,長久下來可說是一個不小的開銷。然而,我個人來說,非常鼓勵你一定要花錢體驗不同的 AI 產品,並且以終為始,思考如何運用 AI 提升生產力以及可獲得的報酬。
工作場景需求 | 過去 | 現在 | 代表性產品 |
---|---|---|---|
影片剪輯 | 手動修空白、停頓片段 手動修圖 手打逐字稿 | 自動刪除空白、停頓片段 自動修圖 自動生成字幕 簡化人工作業流程 | Descript Type Studio Vidyo Gling |
動態影片生成 | 一個一個錄影給客戶 一個一個打電話 | AI 協助你大量產生客製化影片 | Maverick BHuman Tavus |
聲音剪輯 音效處理 | 手動修空白、停頓片段 手打逐字稿 手動修掉雜音 | 自動刪除空白、停頓片段 自動生成字幕 自動處理雜音 簡化人工作業流程 | Descript Cleanvoice Podcastle Adobe Podcast Krisp Murf AI |
寫作/文案 | 絞盡腦汁想點子 花時間整理句型 花時間確認文法 花費時間找靈感 花費大量時間整理資料 | 專注在創意、點子的核心 AI 輔助寫作 | Jasper Rytr Copy.ai ClosersCopy Friday Copysmith.ai Writesonic Smart Copy Frase Ocoya ChatGPT – OpenAI |
圖像/視覺設計 | 人工去背 人工畫圖 人工修圖 人工構圖 人工找圖 人工製作簡報 | 自動去背 自動畫圖、修圖 自動產生大量構圖 自動找相似圖、文字產生圖片 自動產生簡報大綱、內容 簡化設計師工作流程 | Midjourney DALL·E 2 – OpenAI Stable Diffusion niji・journey Flair PatternedAI Illustroke Stockimg.ai Canva |
電子商務 | 人工製作素材 人工撰寫文案 人工 A/B testing | 自動量產素材 自動撰寫、改善文案 自動 A/B testing 簡化人工作業流程 | Copymonkey Bloom AI Pencil AdCreative.ai |
音樂合成、編曲 | 人工創作 人工找靈感 高手才能創作 | AI 輔助創作 一般人也可能創作 簡化人工作業流程 | MuseNet – OpenAI beatoven.ai Boomy SOUNDRAW AIVA Harmonai Amper Music |
客服系統 | 人工建立罐頭訊息 人工判斷、分線 人工建立常見問答 人工處理例外狀況 | 自動建立常見問答 自動判斷例外狀況及可能的處理方式 簡化人工作業流程 | Quickchat Ada Yellow.ai Kore.ai |
軟體開發 | 工人智慧 開始寫之前問 Google 開始寫之後問 Google 上 GitHub 找答案 上 StackOverflow | 開始寫之前先問 AI 寫到一半問 AI 寫完不 work 問 AI 寫完會 work 也問 AI 建議還是上 StackOverflow 對答案 | GitHub Copilot Tabnine CodeGeeX GPT-Code-Clippy |
以下每個段落的介紹,我會挑出 2 到 3 個特別值得一提的產品,以及簡短地介紹該產品的特色。如果沒被我介紹到的產品,也歡迎跟我分享,我會花時間研究一下。
Descript 跟 Type Studio 做的事情非常相似,簡單來說就是幫你把你錄好的影片,運用 AI 技術判讀出逐字稿之後,你只要在逐字稿進行段落的編輯、刪減,它就會自動幫你改寫對應的影片段落、幫你加上影片的字幕。
Vidyo 在短影片當道的時代非常值得一看,所有的功能都是圍繞著協助影音創作者可以更有效率地製作短影音為主,像是快速剪輯、快速上字幕、快速調整影片尺寸等。
Gling 則是強調在幫你節省剪接的時間,自動刪除沒聲音、多餘的段落,方便談話性的 YouTuber 可以更加專注在創作本身。
我個人花最多時間研究的是 Descript,2019 年九月的時候 Descript 宣布 A 輪融資的消息並宣稱要讓 AI 學習使用者的聲音後,讓 AI 可以「將文字稿直接輸出為聲音」。若各位讀者還有印象的話,這個時期就是各種 deep learning 深度學習的應用、也就是各種 deepfake 開始如雨後春筍般冒出來的時期,偽造的影像、聲音可說是初步讓世人們見識到原來演算法、人工智慧已經可以搞到這樣了。
Descript 早期的訴求非常簡單,宣稱只要你會用 Word,你就可以運用 Descript 輔助你的創作。Descript 的運用流程大致如下:
換言之,早期的 Descript 比較像是專注在聲音的處理上,而非影像的處理,而 Descript 這樣的題目所屬的賽道是非常競爭的,因此目前的 Descript 已經不再只是個聲音編輯軟體,目前也變成影像編輯軟體了!實在厲害。
另外分享兩個我個人滿欣賞的影像剪輯的應用,分別是被微軟收購的 Clipchamp 以及正在努力中的新創 VEED,這兩個產品都提供了簡單好用的網頁剪輯應用、豐富的影像、聲音素材庫,同時也整合了 AI 語音辨識可自動替影片加上字幕(有支援繁體中文),非常推薦。
Maverick 跟 BHuman、Tavus 的性質有些類似,應用的方向也挺特殊,決定單獨為了這兩個新創寫一個小分類。想像你正在經營一個需要高度與消費者、客戶持續互動往來的生意,每當有消費者決定不續約,或是你正打算推出新的優惠、新的產品,你便打算用影片跟消費者打招呼。
拍攝影片打招呼的模式,通常開頭都是說「嘿!大家好」,而這類應用的目標,就是要讓你做到你寄給你每一位尊貴的客戶時,影片內容都是獨一無二的,例如開頭不是大家好,而是 Hey, Alex 好久不見、Hey Lawrence 好久不見、Hey Steve 好久不見!
其運用的技術就是透過 AI 學習你講話的聲音、語調及模仿你講話的表情,試著動態產生大規模不一樣的影片,非常簡單直觀的應用,但我也滿好奇這樣的應用實際在商業上的效果如何。
儘管 Descript 目前比較像是以影像為主的軟體,但無論是產品本身的前瞻性、技術力或是業界名聲,依然都還是值得將 Descript 擺在聲音剪輯類的第一位。
Cleanvoice 的應用非常簡單,主要是將你錄製的 podcast 節目中出現的 uhhhhhh、sssss-sounds、嘖嘖聲以及思考時的 ummmmm 等聲音以及口水聲、口腔本身造成的聲音也都會一併處理,讓聲音變得更加乾淨。
Podcastle 則是號稱可以讓你擁有錄音室等級的錄音品質,並且提供了運用 AI 技術的編輯界面,像是自動提供語音辨識的逐字稿、與 Descript 類似的 text-to-speech 功能讓你可以透過編輯逐字稿就能修改錄音內容。若是從號稱「錄音室等級」的 podcast 訪談錄音節目來說,我個人還推薦另外兩個不錯的產品可參考,像是 Riverside.fm、IRIS。
Krisp 是提供給任何想要「安靜開會」 的人的超級好軟體,Krisp 可以協助你在開會時,運用 AI 的運算技術,幫助你在會議上去除你所處環境的雜音、噪音,與你開會的對象不僅不會聽到噪音,應該還能感受到你的麥克風收音品質真好、沒有其他的雜訊,包括像是小孩哭鬧、寵物亂叫、路上的車流聲以及家裡的電器聲等等,Krisp 都可以替你處理。使用 Krisp 不需要配合指定的會議軟體,無論你是用 Zoom、Google Meet 或是任何的會議軟體,Krisp 都可以搭配使用。
Adobe 在 2022 年底也推出了 Adobe Podcast 號稱 AI 賦能的聲音編輯軟體,一樣提供了錄音、自動轉逐字稿(可多人同時錄音並自動辨識不同段落)、剪輯(刪除逐字稿裡面不想要的段落就可以自動刪除對應的片段)。
Adobe 這樣的大象雖然動作總是慢了點,但因為財大氣粗,通常一出手的樣子可能也不會太差,推出 Adobe Podcast 的同時還公開了目前免費的「音訊強化」服務 Enhance Speech from Adobe,上傳你錄製好的聲音檔,Adobe 就會協助你降底噪、讓錄好的聲音更乾淨。
Jasper,可說是美國新創界的新星,2022 年 10 月剛擠身獨角獸俱樂部,Jasper 運用了 OpenAI 提供的強大 AI 造就了強大的寫作 AI,從首頁上可以看到無論是寫部落格、廣告文案、行銷文案、銷售信件、SEO 內容,甚至是寫情書,都難不倒他。如果你已經透過 ChatGPT 體會過 AI 寫作的驚人魅力,那你可以想像 Jasper 就像是把 AI 訓練地更好的詠唱者,他們知道你比更多的指令、祕技,擁有更多現成的模板,降低你入門與 AI 互動的門檻。
如果相對於每個月 US$49 起跳的 Jasper 對你來說太貴,同樣採用 GPT-3 為核心基礎的 Rytr 將會是你最好的選擇,提供了簡單的介面讓你選擇寫作目的、寫作風格,同時支援各種語言(有繁體中文)。
同樣採用 GPT-3 的寫作類 AI 產品還有像是 Copy.ai、Copysmith、Writesonic、Peppertype、Anyword,甚至如果你是網路行銷人員或是 SEO 專家,有一家名叫 Surfer 的 SEO 軟體公司你應該不陌生,其背後也是採用 GPT-3 的 API,由於 OpenAI、GPT-3 已經造就了太多此類服務,容我就不一一介紹,個別產品的魅力、特色、價格,儘管略有不同,當你一旦理解背後都是 GPT-3 之後,應該就可以想像選擇產品的方法,更像是要選擇一個「夠聰明的產品」,才能將背後的 AI 運算能力發揮到更好的境界。
至於 ChatGPT 本身,我想對許多人來說就相當熟悉了,在此提供幾個我個人非常愛用的小技巧:
寫作、文案類可說是我個人最感興趣的賽道,首先這個類別非常實用,我認為是無論你是在什麼產業擔任任何職務,使用這類的服務都可讓你如虎添翼,小至運用 AI 協助你撰寫更流暢、更好閱讀的 email、協助你調整語氣、確認文法,大到協助你構成一個企劃案、勾勒文章的大綱,甚至協助你編輯文章等。
寫作文案類的賽道非常競爭,不確定是不是因為這個賽道相對於影像、聲音類的門檻來得較低,但在 ChatGPT 以及 Open AI 的 API 釋出、伴隨著 Microsoft Azure 也即將推出 GPT-3 為基礎的 Azure OpenAI service,我想以純文字入門的各種 AI 新創產品或整合 AI 的各種功能應用,將會是今年能持續看到的發展方向之一。
寫作文案類的眾多玩家中,最值得一提的是 Jasper,Jasper 在 2022 年 10 月完成了 1.25 億美元的 A 輪融資後,估值也達到了 15 億美金,這次 Jasper 值得一提的第一個亮點,他目前是可號稱獨角獸的新創公司。另一方面,Jasper 貴為獨角獸的同時,近期人們也了解到,Jasper 雖然是一個所謂的 AI 新創,但他其實是 OpenAI 的最大客戶之一,Jasper 背後所使用的 AI 技術就是運用 OpenAI 的 API 所搭建起來的,換言之我們可以想像 Jasper 是屬於一個「加值應用」的軟體開發商,其運用 OpenAI 的 API 以及一系列事先定義好的模板、語法,讓以 GPT-3 為核心的 API 可以在 Jasper 的產品中有一定程度的表現。
提到模板,另外值得一提的是 Ocoya,Ocoya 不完全是 AI 寫作工具,Ocoya 的定位是社群貼文的管理軟體,所以從貼文的構成,包括圖片、文字內容以及縮網址還有發布排程等問題他都處理了,不過其中有特別強調運用到 AI 的部分就是文案撰寫。乍看之下這似乎也沒什麼,不過我們可以注意到很類似 Jasper 的一種 AI 運用模式,Ocoya 提供了適合 Google 廣告文案撰寫、Quora 問答撰寫、電商產品文案、YouTube 影片資訊欄、Facebook 廣告文案撰寫、產品開箱評論文案撰寫等預設樣板,若熟悉 ChatGPT 的朋友,應該幾乎可以想像這類所謂的樣板,其重點就在於一些特定的指令集合,讓 ChatGPT 可以有較高品質、合乎預期的產出(畢竟是要賣錢或是募資的嘛)。
在 ChatGPT 幾乎一夕爆紅之後,Jasper 的營運方式,想必會出現兩種問題:一是自身必須在其「加值應用」的核心業務上,加上更多美麗的糖衣或是更加扎實的應用,來避免對於 OpenAI 的過度依賴以及持續的驚人費用;二是想必 Jasper 這個獨角獸也啟發了來自全世界各地的創業者、競爭者,會有更多的人投入成為 OpenAI 生態系的一員,一同在加值應用的戰場上提供更多元、好用的產品 —— 無論如何,終端消費者肯定是受惠的。Jasper 最近應該很努力,最近主辦 The Gen AI Conference,整場會議共有 17 位講者,Jasper 就佔了其中 6 位。
ChatGPT 其背後所代表的 GPT-3 家族之強大(資料量、演算法、運算模型、持續增長的使用量以及獲取的資料量、財務實力、研究團隊、微軟),頗有未來一舉拿天下的氣勢;此外,ChatGPT 現階段已經能產生的應用範圍便相當可觀,但由於介面是以文字為主,我先將之放在寫作文案類,ChatGPT 目前協助產生文案、大綱、候選標題,或是協助編輯、改寫文章,甚至是從無到有產生可讀性不差的文章,都是 ChatGPT 已經能做到的。你甚至可以指使 ChatGPT 在對答過程中進行角色扮演,或是運用某個知名作家、大師的寫作風格進行臨摹、創作,可說是彈性非常非常地大。
圖像、視覺設計的,我想簡單分為兩個小類別,第一類就是 Midjourney、DALL·E 2 為首、引領市場的這種生成式 AI,第二類則是比較容易運用於商業應用、實戰、相對簡單的小工具。
剛開始說真的 DALL·E 2 並沒有給我帶來太大的衝擊與想像,當初印象很深刻是覺得這似乎是給視覺設計師使用的「技能強化外掛」,例如多年前常在知名論壇上看到有網友可能發了一帖求救文,想拜託網友幫忙在出遊的照片上移除不小心拍到的路人,DALL·E 2 可以運用 AI 強大的學習與判斷能力,自動移除照片中不應該有的物件、加上應該有的細節,甚至同時考慮了光、影效果,非常強大。
後來是因為陸續看到了許多網友開始運用 Midjourney 產生出各式各樣經驗的作品,我才後知後覺知道 Midjourney 的發展歷程在 v3 過渡到 v4 的過程似乎有了相當幅度的提升,繪圖成果的質感、細節都比前一代細膩不少。也大約是到這個階段,我開始意識到,生成式 AI 以及 AIGC(Artificial Intelligence-Generated Content) 將賦予像我這樣完全不懂繪圖、藝術的麻瓜,一種全新的可能性 —— 我們可以從藝術賞析、鑑賞開始。
Flair 目前還在封測當中,從首頁提供的動畫看起來非常有意思,首先上傳自己的商品圖片,接著透過輸入指令(prompt、咒語)產生符合自己品牌風格的商品圖之後,就有高質感、擁有設計風格的圖片可以使用了。有意思的部分是一般人剛入門 AI 指令、咒語,經常苦於不知道使用哪些詞彙、有哪些形容方法,Flair 的介面直接提供了很簡單的引導方式 —— 你用搜尋引擎就會看到的自動完成(autocomplete);同時 Flair 還提供了幾個基本的教學影片,引導人們成為更好的 AI 詠唱者。我覺得這是一個很好的發展方向,主要有兩個部分值得學習:一是透過介面的設計降低一般人與 AI 互動的門檻;二是運用在特定領域,可提高 AI 生成結果的平均品質。
PatternedAI 運用 AI 替你產生各式各樣可拼接的花樣、圖樣,你可以將這些圖樣實際輸出為布料做成褲子、床單之類的,或是輸出成壁紙、馬克杯等生活中的實際用品。由於是 AI 產生的圖樣,有很高的機率這些圖樣是獨一無二的,同時,網站上也宣稱透過其產生的圖樣是 royal-free、無須繳後續版稅的。
Illustroke 可以讓你輸入簡單的文字生成 SVG 圖片,有別於現行主流的「詠唱咒語」的方式,Illustroke 只需要輸入基本的關鍵字,接著選擇風格、圖層數量,便會產生對應的 SVG 插畫圖片給你。
Stockimg.ai 的主要訴求是運用 AI 協助你快速產生可立即投入商業使用的各種圖片素材,像是書籍封面、桌布、海報、logo、插畫等,不過儘管如此,可以感受到其背後所使用的 AI 應該是目前主流的 AI 引擎之一,無論從風格、細膩度來說,可能都僅能供基礎的取材、尋找靈感使用,而不適合直接運用在商業戰場上。
Canva 是目前正在快速改變產業、市場生態的一家公司,可以想像有許多人目前已經不用 Microsoft Office、Google Docs、Apple Keynote 等產品,而是幾乎使用 Canva。隨著 Canva 推出文件、簡報等超越過去以「圖像設計」為主的產品後,在發表新產品的同時我們也可以注意到 Canva 推出了 Text to Image app,你可以在 Canva 中直接給予文字指令(咒語)並接著直接在 Canva 中取得你心目中所想像的圖片。對於很會施咒的設計師來說,此舉無疑是大大簡化了工作流程、不用額外花錢,還能創造出可能獨一無二的圖片在自己的作品中合法使用,真棒。
除了上述產品,若多試著探索一些可能相關的 AI 新創與產品,可以注意像是 designs.ai 或是 beautiful.ai 兩家公司都強調自己有 AI 的功能可以協助你做出更精美的簡報,不過若稍微看一下他的產品介紹或是影片就會注意到他們提供的是很簡層的 AI 運用,例如做 text-to-speech 用 AI 幫你配音製作簡報,儘管也是有善用了 AI 技術,但整個產品的核心並非由 AI 構成(當然如果從這個角度來看,Canva 的 text-to-image 也是相對較淺的應用,不過找圖、選圖、修圖畢竟是視覺設計過程中的核心流程,相較來說這是比較接近核心的功能,也影響了一個設計師是否會依賴這個產品、功能)。
我特別拉出一個電子商務類,但這類其實比較像是文案 + 圖像設計的特定產業應用。
CopyMonkey 可以協助在 Amazon 上銷售商品的賣家,自動將商品的商品名稱、商品簡介以及完成的商品介紹,進行全自動化的改寫,可以想像如果你自己能善用 ChatGPT 或是 Jasper 你就可以完全掌握這件事情了。然而在電子商務領域,可能有幾個特性本身就帶來了一些可能的商機:
Bloom 做的則相對簡單,將商品圖片運用不同的背景搭配,試著找到轉換率最高的組合,在數位廣告領域有許多動態產生各種廣告看板的應用,AdCreative.ai 便是其一。
音樂合成、編曲類的產品,有一個非常重要的點在於產生所謂「無版權、無版稅音樂」(royalty-free music),透過 AI 與自己的巧手編輯後的配樂,能產生一定的獨特性,好的音樂又能對於影像作品有非常大程度的加分效果,若能兼顧不想要持續付出版稅的成本考量,那麼就堪稱完美了。
我非常推薦 Soundraw 非常值得一玩,最主要的原因是無需註冊、登入就可以體驗,其次是操作介面非常簡單,選擇你想要的音樂風格、接著就有一堆範例音樂,讓你自行調整每一段音樂的強弱,如果開啟了 Pro 專業模式,可以如下圖針對 Melody、Backing、Bass、Drum、Fill 等細節進行設定,還可以設定拍子快慢、調整使用樂器的搭配組合以及升降調,可說是非常有彈性,隨便點幾下就可以配出有自己喜愛風格的音樂。
另外由 sutterstock 推出的 Amper Music 也非常值得一試,背後了有豐富的曲庫可以選擇之外,其後台直接就是一個影音編輯器,你可以直接上傳自己剪輯後的影片、在後台搭配音樂感受效果,後台選擇曲風之後,可以進行升降調,可以決定個別樂器的音色、節拍等,對於想要稍微掌控音樂演奏細節的人來說應該還算堪用。
Amper Music 在建立專案後問你的第一個問題便是:「請問你的音樂長度要多少呢?」,此時你可以選擇手動輸入,或者是讓他根據你上傳的影片決定,感覺非常適合影音創作者。
我自己生活在北美,生活中經常接觸到許多 AI 客服系統,從我最常消費的 Amazon 擁有可用度非常高的文字聊天機器人之外,無論打電話到政府機關、銀行、電信公司或是私人公司,接聽電話的語音客服經常是帶有語音辨識系統的 AI 客服,儘管可以感受到不同公司所使用的 AI 程度落差之大,但以北美這種高人工加上缺工的地區來說,最前線的客服人員可以使用 AI 就使用 AI,AI 在最前線排除或篩選問題後,才進到真人客服進行下一步處理,分工合作,讓人力可以運用在更需要人為判斷的問題上來維持服務品質。
倘若你經營電子商務或是 SaaS 公司,主要接觸消費者的管道是網路、電話或是手機 app,那麼可以提供語音辨識或是文字解析能力的對話式 AI 客服(Conversational AI),想必會是提高服務品質、提升回應速度並降低公司固定費用的重要發展方向之一。
嚴格來說,我們並不能把 ChatGPT 當成客服系統,一來 ChatGPT 主要用途在於 OpenAI 公司用來作為公司技術實力的火力展示,倘若一家公司想要採用以 AI 為主要特色的客服系統,想要套用到特定商業場景,還須涉及資料建模、訓練並通過一定的品質確保流程,這顯然會牽涉到非常多繁複的細節,像是資料的整理、整合,同時還需要考慮哪些屬於營業秘密的資訊是不想提供給第三方廠商的。
不過現階段來說,不考慮太複雜的場景,確實已經有些新創公司已經勇於開始提供有內建所謂 AI 的客服系統了,以下整理幾家:
其中特別值得一看的是 Quickchat,號稱 powered by OpenAI,同時是 Y Combinator 的團隊(2018 年春季班),儘管看起來是稍有歲數的 YC 團隊了,但還是滿令人期待。
由於多數公司所提供的客服,提供的問答多半是比較基礎、程序性的問題,通常也不會涉及較為複雜的判斷,從 AI 發展的博大精深來說,最終客服所需要的並不會是超級強大、什麼模糊問題都能解的 AI,客服系統需要的反而更是能深入理解公司業務範疇並能精準回覆客戶需求的特定領域的 AI。因此,我也相當期待會有越來越多的客服 AI,開始能在 Facebook Messenger、Whatsapp、Instagram、LINE 等系統裡面開始提供服務。
GitHub Copilot 是在 2021 年初次面市,如果搭配著看 GPT-3 的發展,回頭看 2018 年微軟收購 GitHub,就會發現這一切實在合理到不行,微軟早在 2016 就開始提供 Azure 的算力給 OpenAI 使用,到了 2019 年投資 OpenAI $10 億美金、2020 年取得 GPT-3 的授權,接著相隔不到一年 GitHub Copilot 就開始進行公測了。
基於對於 GPT-3 的敬畏以及 GitHub 的訓練素材庫供應了幾乎所有語言在各種情境下的資料,我個人滿推薦無論你是不是專職的工程師,只要你的生活中有機會撰寫、修改程式碼,那麼花一點小錢租用 GitHub Copilot 會是一個非常值得的投資,GitHub Copilot 可以幫助你更有效率地勾勒出你的想法,也可以協助你更有效率地除錯,甚至還可以從 GitHub Copilot 提供的程式碼不斷學習、提升自我。
其他幾套我就真的是沒有玩過了,不過我個人還是相信世界需要良性競爭,倘若 Google 與其他業者再不爭氣點,在未來的好一段時間我們除了 GPT-3 及其後繼者沒能有其他更多選擇的話,那麼世界可能會因此變得無聊,而且也可能會有點危險。
本篇所整理的應用主要以語音辨識、視覺辨識、生成式 AI 等 AI 工具應用為主,目前世界上幾乎每天、每個禮拜都會出現新的 AI 應用,包括各種加值服務應用以及各類小工具,應用在特定場景、特定產業的工作流程,藉此協助人們提高生產力、省下更多時間,如果你有什麼不錯的工具想與我分享,歡迎寄信到 hi _at_ limitpress.com