跳到主要內容

發表文章

CSS Animation 救星?Apple 推出 Keyframer,讓 LLM 大型語言模型產生動畫

CSS Animation 救星?Apple 推出 Keyframer,讓 LLM 大型語言模型產生動畫 Apple 釋出 Keyframer 工具利用大型語言模型(LLMs)來為靜態圖像(SVG格式)創造動畫。 透過與專業動畫設計師和工程師的訪談,Keyframer 支援通過提示和直接編輯生成的輸出來探索和精煉動畫。此系統還允許用戶請求設計變體,支持比較和創意發想。包括用於描述運動的語義提示類型的分類和一種“分解式”提示風格,其中用戶不斷根據生成的輸出調整他們的目標。分享了如何通過直接編輯以及提示來實現超越當今生成工具中常見的一次性提示界面的迭代。通過這項工作,提出了LLMs 可能如何賦能廣泛的觀眾群體參與動畫創作。 對於網頁開發者或設計師,Keyframer提供了以下潛在的幫助和用途: 創意表達的擴展:開發者和設計師可以使用自然語言描述來創造或修改動畫,這樣可以快速實驗和實現創意想法,而無需深入複雜的動畫程式碼或工具。 高效的設計流程:通過結合語言提示和直接編輯,使用者可以迅速探索動畫設計的不同變體,加速從概念到原型的過程。 動畫設計的無障礙化:即使是沒有動畫背景的開發者和設計師也能輕鬆入門,透過自然語言的引導創造動感豐富的界面和視覺效果。 促進創意發想和迭代:Keyframer支持設計思維的迭代過程,讓使用者能夠不斷優化和細化他們的動畫設計,促進創意的深入發展。 個性化和定制動畫:用戶可以請求特定的設計變體,以滿足特定項目的需求或遵循品牌指南,從而創建更加個性化和定制化的動畫效果。 Keyframer為網頁開發者和設計師提供了一種全新的與動畫互動和創造的方式,使他們能夠更加自由地探索和實現創意視覺效果,從而提升用戶體驗和網站的吸引力。
最近的文章

消費者如何看待付費與免費的AI服務和工具 - A16Z 不專業摘要翻譯

消費者如何看待付費與免費的AI服務和工具 根據 A16Z 分析報導,自ChatGPT問世以來,它迅速成為生成型AI領域的焦點。在短短9個月內,它以驚人的速度吸引了1億的活躍用戶,預示著一個AI新時代的到來。然而,市場上還有其他哪些AI工具?老牌企業和新進公司又分別站在何處?讓我們深入探索生成型AI的現狀和未來趨勢。 自ChatGPT推出已有9個月,且在7個月內成為最快達到1億月活躍用戶的消費者應用,開啟了生成型AI的新時代。 但除了ChatGPT,消費者如何與生成型AI(GenAI)產品互動?哪些類別是老牌公司主導的,而哪裡又有新公司崛起?誰可能是下一個“大贏家”? 為了回答這些問題,我們查看了SimilarWeb於2023年6月的流量數據,對月訪問量最高的50大GenAI網站產品進行排名。我們還分析了這些產品隨著時間的增長,以及增長來自何處。 我們依賴網頁流量而非應用流量來“確定”公司上榜資格,因為到目前為止,大多數消費者GenAI產品首先是網站形式(下面還有更多相關信息!)。對於上榜且擁有移動應用的公司,我們加入了那些流量,該數據來自2023年6月的Sensor Tower,以確定他們的排名。因此,此排名可作為識別和理解類別趨勢的工具,而不是所有消費者AI平台的詳盡排名。 前6個主要觀察 大多數領先的產品都是從“零開始”圍繞generative AI建立的。 目前,ChatGPT擁有巨大的領先優勢… LLM助手(如ChatGPT)是擁有領先地位,但輔助工具和創意工具正在崛起。 早期的 “勝利者” 已經浮現,但大多數產品類別還未定論。 頂尖產品的收購完全基於消費者願意支付意願! 移動應用仍在作為一個GenAI平台崛起。 其中,特別提到在過去的5年中,許多消費者應用一直陷入了一場收購遊戲中。沒有平台的轉變(例如,從互聯網→移動裝置),很難為新產品帶來興奮感。收購成本也在上升,這意味著大多數消費者公司都必須擔心如生命週期價值和客戶獲取成本等指標。 生成型AI(GenAI)改變了這一遊戲。此列表上的大多數公司都沒有付費行銷(至少,SimilarWeb能夠歸因的那些)。通過X、Reddit、Discord和電子郵件,以及口碑和推薦成長,有大量的免費流量“可用”。 這些GenAI產品的底部四分之一僅有2%的流量來自付費來

初級工程師的迷霧:解析開發中常見的困擾與挑戰

在我和工程團隊的共事歷程中,我注意到初級工程師經常遇到的問題。這些問題,無論在面對簡單或複雜的挑戰時,都能體現出來。歸納起來會有常見以下幾個面向。 簡單的問題 發現許多初級工程師在面臨簡單或複雜的問題時,常有可能會遇到困難,時常會有一種繞圈圈的氛圍, 常見問題分別有, 問題本質 首先是對於問題本質上並沒有釐清完成的目標,以及問題本身是要解決什麼樣的商業問題,客戶問題,導致於因為總總原因,做了 scope 過大,或者,花了過多時間進行 over design 的問題發生。 過度依賴套件 發現在新手開發中,會發現為了解決單一問題,卻引用了一大包的 libary 或者引用了不適合此問題的套件。在求解的過程中,容易導致要解決套件的問題,而忘記了要解決的問題是什麼。 複雜的問題 我們在面對複雜的問題時,經常會因為缺乏策略與經驗而感到困惑,反而在處理看似簡單的問題時,卻可能因為過度依賴套件或缺乏組合技巧,而陷入泥淖。不論是複雜或是簡單的問題,我們都需要找到更有效的解決方式。 不論是經常過度依賴套件求解,又或者複雜的問題不知道如何拆解。因此導致新手可能會感到無所適從,不知道如何運用組合技巧。因此,他們往往在處理看似簡單的問題時,容易陷入困境,導致專案的時程延宕。 特別是各自工程師都有開發壓力時,身為新手開發者就更難與資深開發者進行討論,從中汲取前輩的經驗,轉化成自身的價值發生。 解決的方向 上述的問題,自己再開發的時候也或多或少會發生,當然在新入門者更是容易深陷其中,不知如何自拔。 除了參與社群,從傾聽到互動的過程中,從前輩的經驗進行思考及內化的過程。 在 AI Generated 時代,我們可以透過 LLM 透過適當的思考方式和問答過程,逐步的逼近答案,也許是一條可以進行的道路。 這裡,會以透過內部訓練的經驗,提出如何以 ChatGPT 這樣的工具為例,提升對於新手工程師的幫助。 透過 ChatGPT,我們可以解決許多類似的問題。例如,我們可以透過 ChatGPT 建立一個問答系統,進行問題分析,或是請 ChatGPT 提出最適合的工具和方法來解決問題,尤其是那些可以透過使用基礎 function 就能處理的簡單問題。這不僅能讓我們避免過度依賴套件,更能發掘並利用基礎工具的能力。 工商時間 7/3 (週

Google 發表 StyleDrop 模型,挑戰Midjourney的設計革新

Google 研究團隊發表了一個名為StyleDrop的技術,該技術能夠生成忠實遵循特定風格的圖像。這項技術由一種名為Muse的文本到圖像生成的視覺變換器提供核心。StyleDrop具有極高的通用性,能夠捕捉用戶提供的風格的細微差異和細節,例如色彩方案、陰影、設計模式以及局部和全局效果。 https://styledrop.github.io/ StyleDrop 的工作方式是通過微調非常少參數有效地學習新風格,並通過與人類或自動反饋的迭代訓練來提高品質。 令人驚訝的是,即使用戶只提供一張指定所需風格的單張圖像,StyleDrop也能夠提供令人印象深刻的結果。 StyleDrop可以生成由單一參考圖像描述的任何風格的高質量圖像。在訓練和生成時,都會在內容描述符後附加自然語言的風格描述符(例如,“融化的金色3d渲染風格”)。 StyleDrop生成具有由單一參考圖像描述的一致風格的字母圖像。在訓練和生成時,都會在內容描述符後附加自然語言的風格描述符(例如,“抽象的彩虹色的流動煙霧波浪設計”)。 以下為優缺點分析, 優點 風格通用性:StyleDrop能夠捕捉用戶提供的風格的細微差異和細節,例如色彩方案、陰影、設計模式以及局部和全局效果。這對於生成與特定風格或品牌相符的圖像非常有用。 高效學習新風格:StyleDrop的工作方式是通過微調非常少的可訓練參數(總模型參數的1%以下)有效地學習新風格。這意味著可以以更少的時間和資源來調整和定製模型。 單張風格圖像轉換:即使用戶只提供一張指定所需風格的單張圖像,StyleDrop也能夠提供令人印象深刻的結果。 缺點 需要專業知識:StyleDrop需要使用者有一定的機器學習和圖像處理知識,才能理解和有效利用其功能。 對資源的需求:雖然StyleDrop只需微調少量參數就能學習新風格,但對於大型圖像或複雜的風格,仍可能需要大量的計算資源和時間。 風格轉換的限制:雖然StyleDrop可以從單張圖片學習風格,但如果風格特別複雜或難以定義,其結果可能不會完全符合期望。(2023/06 發表日的此時是如此) 後續 到底 StyleDrop 會不會帶來另外一個生成式影像的衝擊,還是又是一個雷聲大雨點小的 Another google project,在此時此刻( 2023/

跨越語言壁壘 - Meta 釋出 4,000 種語言識別的 AI Model

世界上有超過 7,000 種語言,而在這繁多的語言中,許多卻面臨著逐漸消逝的命運。 為了翻轉這種情況,開發一種能夠識別和支援各種語言的技術變得至關重要。這就是我今天要跟大家分享的話題 —— Meta 釋出大規模多語言語音(Massively Multilingual Speech,簡稱 MMS)模型,以及其如何與 OpenAI 的 Whisper 語音 AI 系統進行比較。   首先,讓我們了解一下 MMS 模型。這種模型是一種人工智慧模型,其功能遠超過任何前一代的語音識別技術。傳統的語音識別技術通常只能支援大約100種語言,然而,MMS 模型卻將這一數量增加到了1,100種,同時還能識別超過4,000種語言,這可是前所未有的突破。 https://about.fb.com/news/2023/05/ai-massively-multilingual-speech-technology/   相比之下,OpenAI 的 Whisper 語音 AI 系統,雖然也提供了相當強大的語音識別功能,但其主要的訓練數據集仍然以英語為主,因此在多語言識別方面,可能無法與 MMS 模型相提並論。  然而,值得一提的是,MMS 模型是基於公開的宗教文本——特別是聖經——進行訓練的。這種訓練方法既巧妙又有效,能夠獲得各種語言的大量語音資料。這種方法讓我們可以識別和支援更多的語言,並讓每個人都能夠以他們自己的語言和 AI 進行交流。  後記 未來,希望可以擴展 MMS 模型的功能,使其可以支援更多的語言,同時也將面臨到處理各種方言的挑戰。 當然,這絕對不是一個輕而易舉就能完成的任務,但我們相信,只要有了足夠的努力和創新,這個目標絕對是可以達到的。 最後,我想強調的是, MMS 模型 和 Whisper 語音 AI 系統 都是我們在語音識別領域的重要里程碑。儘管它們在多語言支援上存在一定的差異,但它們的出現無疑都為語音識別技術的發展打開了新的可能性。我們期待看到更多的創新和突破,在這個領域裡,未來一定充滿無限可能。

AI 金融處理進行式,政府建立監管政策與法規框架:確保金融機構遵守道德與合規要求

金管會對機器人理財進行法規加強管理,主要目的是為了降低投資風險和保護投資者。由於機器人理財的資產管理規模和客戶數逐年增長,金管會認為有必要對此類金融服務進行更嚴格的監管。文章並未提及防止洗錢或避免利益過度膨脹作為加強管理的主要原因。 戰AI!金管會對機器人理財開第一槍 違規最重處1,500萬元 金管會希望將目前仍屬於「自律規範」的機器人理財納入《投信顧法》,提升法律位階。這樣做的目的是要確保機器人理財的演算法合理、有效並防止人為修改。為此,金管會將成立專家小組,對各業者的機器人理財演算法進行審查。 此外,金管會還計劃修訂《投信顧法》的子法──投顧事業管理規則,將「自動化顧問服務(機器人理財)」規範納入。這意味著違反相關法規的機器人理財業者將面臨更嚴厲的罰款,從而提高業者遵守法規的動力。 綜上所述,金管會加強機器人理財管理的主要目的是降低投資風險、保護投資者利益,並確保機器人理財演算法的合理性和有效性。 2023/04/19 發表新聞稿, 8月金融科技發展2.0納入AI 金管會:擬定指導原則 金管會所提及的擔憂和害怕,主要集中在以下幾個方面: AI技術的合規性和道德倫理:金管會主委提到了新加坡、韓國、和日本等國家對金融業使用AI技術都有一些抽象性原則,如公平、倫理道德、課責性、透明度等。這些原則旨在確保金融業在使用AI時遵循相應的道德和法律規定,防止不公平競爭和損害消費者利益。 資料安全和個資外洩問題:金管會擔心在金融業使用AI技術時,用戶的個人資料可能被泄露或遭受損害。在使用像ChatGPT這樣的人工智能技術時,金融業需要確保客戶資料的保密性和安全性。 自律規範和法律位階的調整:黃天牧提到,金管會將評估銀行公會新興科技的自律規範,並參考國際上的最佳實踐(如歐盟的規範)。如果現行的自律規範無法滿足未來AI發展的需求,金管會將考慮提升相關法律規定的位階。 綜上所述,金管會主要擔憂AI技術在金融業的應用可能帶來合規性、道德倫理、資料安全和個資外洩等方面的風險。為了確保金融業在使用AI時遵循相應的道德和法律規定,金管會將密切關注國際上的最佳實踐,並在必要時對相關法規和自律規範進行調整。 反面的思考 如果AI在金融領域的應用不合規或不符合道德倫理,可能會帶來以下問題: 金融機構信譽受損:金融機構使用不合規或不道德的AI技

為了兒子,當年辦了一場技術研討會 JSDC 2018

半夜裡,無聊的翻找照片, 看到,以往的過去! 應該也沒有太多人知道,當年 JSDC 2018 ,起心動念只是想要讓兒子兩歲多屁顛屁顛的時候可以跟著爸爸一起看看研討會長什麼樣子! 沒想到,就這樣的堅持又一年! Ryan Dahl 答應參加這場活動,也真的來到!  JSDC 2012 沒有答應的那場約,終於到 2018 的那年還是等到 等待的是這不長不短的六年,每一次舉辦年會的那年,都是在討論這是否就是最後一年! 什麼是社群?有人的地方就是社群。 什麼是技術?只要你願意鑽研,那就是技術。 寫程式能不能寫到老,我的答案會是,『可以!』直到你老到你不能寫為止! 所有的語言戰爭,框架戰爭,瀏覽器戰爭永遠都會在,它永遠都在,就只是換個地方換個方式呈現而已,但它始終在那邊,不是因為它不好,而是因為人! 但過了兩三天,兩三週,兩三年,誰還記得誰?! 也許直到今天, 兒子應該還是以為照片裡的這些人都是英文老師吧! 沒關係,就 ... 英文老師吧! 希望有一天兒子能夠了解 - 能夠完成一次次的饗宴,是多麽開心的一件事情! 希望有一天能夠了解 - 這世界上有許多事情總是要靠失敗來累積,靠得罪來獲得經驗,能夠支持下來的是朋友,不能夠支持也不一定是敵人,很多是是非非當下總會過不去。 但,前輩跟我說! 沒有過去不的事情, 只有過不去的心情! 有一天,我們的長輩會老, 有一天,我們的朋友會老, 有一天,我們都會逝去 那一天,誰又還記得誰? 不一定要走技術這條路,也不一定要做個什麼大風大浪,對得起自己,勇敢追求自己,找到自己所愛,和愛自己的,比什麼都重要! 每個時代都是最壞的時代,每個時代都是有機會的時代,多想,多看,多聽,多學習,勇敢表達自己,讓自己活得像個人!