歡迎來到【AI日報】欄目!這裡是你每天探索人工智能世界的指南,每天我們為你呈現AI領域的熱點内容,聚焦開發者,助你洞悉技術趨勢、了解創新AI産品應用。
新鮮AI産品點選了解:https://top.aibase.com/
1、阿裡釋出 FLUX.1-Turbo-Alpha:基于FLUX.1-dev、8步提煉Lora
阿裡媽媽創意團隊釋出了基于FLUX.1-dev模型訓練的FLUX.1-Turbo-Alpha,采用8步蒸餾Lora模型,多頭判别器顯著提高蒸餾品質,支援多種FLUX相關應用。推薦引導尺度設定為3.5,Lora尺度為1,未來将推出更低步數版本。模型可與Diffusers架構結合使用,通過幾行代碼加載模型生成高品質圖像。訓練過程在超過100萬幅圖像上進行,采用對抗訓練方法,具備6.3以上美學評分,分辨率高于800。FLUX.1-Turbo-Alpha的推出推動了人工智能技術的普及與應用。
【AiBase提要:】
🌟 基于FLUX.1-dev,采用8步蒸餾和多頭判别器,提升圖像生成品質。
🖼️ 支援文本到圖像生成及修複控制網,使用者可輕松建立多種有趣場景。
📊 訓練過程采用對抗訓練,訓練資料超過100萬張圖像,確定模型高品質輸出。
詳情連結:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
2、告别繁瑣對齊!F5-TTS 讓文本轉語音變得輕松自如!
最近,來自上海交通大學、劍橋大學和吉利汽車研究院的研究團隊推出了一種全新的文本到語音(TTS)系統,名為 F5-TTS。這種系統的特别之處在于,它采用了一種無自回歸的方法,結合了流比對與擴散變換器(DiT),成功簡化了傳統 TTS 模型中的複雜步驟。
【AiBase 提要:】
🌟 F5-TTS 是一種新型無自回歸文本到語音系統,簡化了傳統 TTS 模型的複雜性。
⚡ 該系統結合 ConvNeXt 和 DiT,提高文本與語音的對齊效果,提升合成品質。
🔒 研究團隊關注倫理問題,建議引入水印和檢測機制以防濫用。
項目入口:https://github.com/SWivid/F5-TTS
體驗位址:https://huggingface.co/spaces/mrfakename/E2-F5-TTS
3、OPPO 文檔 AI新功能曝光!支援蘋果 iWork 格式轉換、文檔翻譯、掃描文檔等!
OPPO 官方今日釋出了一條預熱消息,宣布即将推出全新的文檔應用。根據預熱消息,這款應用将支援多項功能,包括“檔案随心開”、“AI 随心幫寫”、“格式随心轉換”和“文檔随心搜尋”。
【AiBase 提要:】
📝 OPPO 即将推出全新文檔應用,支援多項 AI 功能。
🔄 應用可進行蘋果 iWork 格式轉換,提升相容性。
📄 提供文檔掃描和翻譯功能,優化文檔處理體驗。
4、螞蟻CodeFuse IDE0.6版釋出 支援編輯器診斷問題 AI 修複
螞蟻CodeFuse IDE0.6版本釋出,新增編輯器診斷問題AI修複功能和内斂補全特性,提升代碼編寫便捷性和效率。IDE支援主流程式設計語言,提供代碼編寫建議、問題修複等功能。
【AiBase提要:】
🚀 IDE新增編輯器診斷問題AI修複功能,開發者可通過懸停觸發智能修複按鈕解決錯誤資訊。
⚙️ 優化代碼智能補全體驗,支援下拉補全和内斂補全同時出現,使用者可通過Tab鍵快速采納内斂補全。
💻 CodeFuse IDE基于螞蟻自研大模型和OpenSumi架構開發,提供智能終端、單元測試生成等功能。
詳情連結:https://github.com/codefuse-ai/codefuse-ide
5、蘋果的 “多模态煉丹爐” 又更新!MM1.5增強文本密集、多圖了解
蘋果公司最近為其多模态人工智能模型MM1推出了重大更新,将其更新為MM1.5版本。這次更新不僅僅是簡單的版本号變更,而是全方位的能力提升,使得模型在各個領域都展現出了更強大的性能。MM1.5的核心更新在于其創新的資料處理方法,包括高清晰度的OCR資料和合成圖像描述的使用,以及優化的視覺指令微調資料混合。
【AiBase提要:】
🚀 MM1.5采用以資料為中心的訓練方法,優化了訓練資料集,在文字識别、圖像了解和執行視覺指令等方面表現顯著提升。
💡 MM1.5涵蓋了從10億到300億參數的多個版本,包括密集型和專家混合(MoE)變體,即使是較小規模的模型也能達到令人印象深刻的性能水準。
🔍 MM1.5的能力提升主要展現在文本密集型圖像了解、視覺指代和定位、多圖像推理、視訊了解以及移動UI了解等方面,拓展了應用場景。
詳情連結:https://arxiv.org/pdf/2409.20566
6、合成資料有毒!Meta團隊證明:1%資料就能讓大模型完全崩潰
最近AI圈子發生了一件怪事,就像一個吃播部落客突然開始吃自己做的菜,越吃越上瘾,菜也越來越難吃。這事兒說起來還挺吓人,專業的術語叫模型崩潰(model collapse)。模型崩潰是AI模型在訓練過程中,如果大量使用自己生成的資料,就會陷入惡性循環,導緻模型生成的品質越來越差,最終完犢子。
【AiBase提要:】
🔍 模型崩潰現象:AI模型在訓練中過度依賴合成資料導緻生成品質下降,最終崩潰。
💡 解決方案:優先使用真實資料,謹慎使用合成資料,控制模型規模,避免模型崩潰。
📈 實驗發現:即使使用1%的合成資料也可能導緻模型崩潰,模型規模越大,崩潰現象更嚴重。
詳情連結:https://arxiv.org/pdf/2410.04840
7、獲獎AI畫作《太空歌劇院》版權申請遭拒
最近,合成媒體藝術家Jason Allen因創作的作品《太空歌劇院》遭到版權辦公室拒絕注冊引發争議。Allen不滿決定上訴,認為作品中有大量人類創作成分,應獲版權保護。AI生成的作品是否應獲得版權保護成為焦點,引發關于AI藝術創作版權法律的讨論。
【AiBase提要:】
🌟 Allen認為作品中有大量人類創作成分,應獲得版權保護。
🤖 版權辦公室認為AI生成作品缺乏足夠人類創作,拒絕注冊。
📜 Allen的上訴可能推動AI藝術創作版權法律的進一步讨論。
8、台積電第三季度利潤增長40%,AI 熱潮助推需求激增
最近,台積電宣布預計第三季度淨利潤将大幅增長40%,受益于AI晶片需求激增。公司客戶包括蘋果、英偉達等知名企業,推動AI技術發展。市場對台積電未來表現樂觀,營收和資本支出計劃均有提升。
【AiBase提要:】
💰 台積電第三季度淨利潤預計将達到2982億新台币,較去年同期增長40%。
📈 台積電的客戶正在推出新産品,推動其業績超預期增長。
🌍 台積電加大投資建設新工廠,未來資本支出預計在300億至320億美元之間。
9、Anthropic CEO:AI将助力人類抗擊疾病5-10年内人類壽命可延長至150歲
在Anthropic的CEO達裡奧·阿莫代伊的文章中,他大膽預測了人工智能(AI)在未來的發展。盡管公衆對AI的風險有所擔憂,但他認為AI的積極潛力巨大,可以為人類社會帶來前所未有的進步。阿莫代伊強調了處理AI風險的緊迫性,并警告過度誇大技術可能帶來的誤導。他展望了AI在生物學、健康、神經科學、心理健康、經濟、貧困和智者國度等領域的變革。
【AiBase提要:】
🔬 生物學和健康: AI能加速醫學進步,控制傳染病、降低癌症死亡率、治療遺傳病,預計人類壽命可翻倍至150歲。
🧬 生物自由: AI賦予人類更多生物學特征控制權,包括生育和外貌選擇。
🧠 神經科學和心理健康: AI應用改善精神疾病了解和治療,提升心理健康。
10、蘋果可能會在明年推出售價2000美元的 Vision 頭顯
蘋果公司計劃推出新型 Vision 頭顯,價格約為2,000美元,采用更便宜的材料和性能更低的處理器。該裝置不包含 EyeSight 功能,是蘋果混合現實計劃的一部分。蘋果還将推出第二代 Vision Pro、智能眼鏡和帶攝像頭的 AirPods,以及價格實惠的類似 iPad 的螢幕和帶機械臂的桌面裝置。盡管混合現實計劃并未取得巨大成功,蘋果仍堅持推進相關産品的開發。
【AiBase提要:】
🔍 蘋果計劃推出價格約為2,000美元的新型 Vision 頭顯,采用更便宜的材料和性能更低的處理器。
🚀 蘋果将在未來推出第二代 Vision Pro、智能眼鏡和帶攝像頭的 AirPods,推動混合現實領域的發展。
💡 蘋果還計劃推出價格實惠的類似 iPad 的螢幕和帶機械臂的桌面裝置,作為智能家居戰略的一部分。
11、谷歌在美國搜尋廣告市場佔有率或将跌破50%
谷歌在美國搜尋廣告市場佔有率可能在2025年跌破50%,面臨新競争者挑戰。新興競争者如TikTok、亞馬遜和人工智能初創公司Perplexity正搶占市場佔有率。亞馬遜在搜尋廣告開支中增長迅速,對谷歌構成壓力。人工智能的發展改變搜尋廣告格局,谷歌計劃在AI搜尋摘要中插入廣告。搜尋廣告市場正經曆深刻變革。
【AiBase提要:】
📉 谷歌搜尋廣告市場佔有率預計将在2025年跌破50%,面臨新競争者的挑戰。
📱 TikTok和亞馬遜正迅速崛起,搶占谷歌的市場佔有率。
🤖 谷歌計劃在AI搜尋摘要中加入廣告,為品牌提供新的投放管道。
12、聯想釋出ThinkSmart Core Gen2專為視訊會議打造 AI助力高效協作!
聯想推出的ThinkSmart Core Gen2為智能協作領域帶來突破,搭載英特爾Core Ultra處理器,強大的AI處理能力提升會議效率,重新定義會議空間和工作方式,實作智能協作體驗。
【AiBase提要:】
💡 ThinkSmart Core Gen2搭載英特爾Core Ultra處理器,內建神經處理單元,AI處理能力強大,能耗降低40%。
💼 支援Microsoft Teams Rooms和Zoom Rooms,提供AI增強功能,包括智能框選、自動語音識别、智能姿态标簽等。
🔒 提供高度自動化和前瞻性管理,預裝ThinkSmart Manager軟體和ThinkShield解決方案確定全方位安全保護。