滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

月之暗面聯創凌晨3小時AMA：回應23問，楊植麟透露Kimi K3將大幅升級

時間：2026-01-30 08:06:49 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

月之暗面核心團隊近日在社交媒體平臺Reddit上舉辦了一場備受矚目的有問必答活動，三位聯合創始人楊植麟、周昕宇和吳育昕與全球網友展開深度交流，話題涵蓋模型技術、行業趨勢以及公司發展等多個方面，從凌晨持續到凌晨三點，解答了眾多關鍵疑問。

活動伊始，就有網友提出尖銳問題，質疑Kimi K2.5自稱Claude是對其進行蒸餾的證據。楊植麟解釋，這是由于預訓練階段對最新編程數據上采樣，而這些數據與“Claude”這個token關聯性強，并且強調K2.5在多個基準測試中表現優于Claude。對于備受期待的Kimi K3，楊植麟雖未透露過多細節，但表示會在Kimi Linear基礎上加入更多架構優化，即便沒有比K2.5強10倍，也肯定會強很多。

在算力儲備問題上，當被問及與其它企業的GPU數量差距在2026年是否會縮小時，楊植麟直言差距并未縮小，實現通用人工智能（AGI）所需的算力還有待觀察。周昕宇則補充道，可用算力受多種因素影響，創新往往誕生于約束之中。

針對技術架構相關問題，有網友詢問對DeepSeek的Engram架構的看法及是否考慮采用。周昕宇認為對嵌入進行Scaling是值得探索的方向，但在測試前缺乏可靠數據。對于訓練大規模模型如何界定沉沒成本，周昕宇表示會將實驗結果分享給技術人員深入討論，以決定項目的走向。團隊鼓勵質疑，每天都會進行相關討論。同時，團隊憑借對技術基本面的準確判斷，在長期研究中取得不錯成果，關鍵在于擁有“把事情真正做成并落地”的共同價值觀。

在模型訓練挑戰方面，楊植麟稱訓練視覺語言模型（VLM）的主要挑戰在于同時提升文本和視覺性能，不過二者可相互促進。對于開發自己的編程工具Kimi Code的原因，他表示需要一個與模型最匹配的框架，且Kimi Code有視頻輸入等獨有功能，video2code代表著前端開發的未來。在強化學習基礎設施方面，吳育昕介紹團隊力求在保持靈活性的同時實現高效率，智能體蜂群部署邏輯復雜，但系統靈活性高，可集成不同框架和子智能體設置。

關于Scaling階梯，周昕宇表示從非常小的規模開始實驗，核心目標是預測系統的可擴展性。有些架構、優化器和數據無法擴展，在低FLOPs下評估可擴展性需要深刻理解訓練過程的數學動態。例如，Kimi Linear移植到K2中時曾出現Scaling失敗，經過數月調試才達到現有水平，研究重點在于應對失敗。

在模型性能與應用方面，對于Kimi K2.5的算力分配，楊植麟認為強化學習的計算量將持續增長，未來可能出現更多新的目標函數用于強化訓練。針對有人探索架構遞歸實現P/poly復雜度的問題，他表示當前架構下許多問題在計算上可解，模型能力瓶頸在于任務可驗證性，智能上限取決于新學習算法。對于K2.5自稱Claude的現象，他進一步解釋在正確系統提示詞下會回答“Kimi”，系統提示為空時反映預訓練數據分布。K2.5在多個基準測試中優于Claude。對于降低K2的幻覺問題，吳育昕稱通過提高數據質量和獎勵機制改善，但仍有改進空間。關于K2.5使用較高參數比例是否“浪費”計算資源，吳育昕和周昕宇認為過度訓練是為了獲得更優整體權衡而主動支付的成本。

在“智能體蜂群”功能上，吳育昕介紹該功能中各子智囊團可獨立執行子任務，擁有各自工作記憶，只在必要時返回結果給調度器，擴展了整體上下文長度。對于權衡強化編程能力與非編程能力，楊植麟表示在模型參數規模足夠的情況下二者不存在根本性沖突，但保持“寫作品味”是挑戰，團隊依賴內部基準評測調整獎勵模型。對于K2.5個性變化問題，吳育昕承認每次新版本發布模型“個性”會有變化，正在努力解決以滿足用戶個性化需求。

對于Kimi K3的規劃，楊植麟表示正在嘗試新架構和新功能。對于是否采用新架構及如何保留K2.5 Thinking性能，他肯定了線性架構，希望在Kimi Linear基礎上加入更多架構優化，相信K3會有顯著提升。對于在線/持續學習計劃，周昕宇稱持續學習可提升模型自主性，Kimi Linear是與K2.5并行開展的項目，線性注意力機制是未來模型關鍵方向。在模型角色塑造方面，楊植麟認為模型核心在于“品味”，K2.5有獨特審美取向，其性格也是“品味”體現，較少迎合用戶或許是好的性格特征。對于是否開源“智能體蜂群”或添加到Kimi-cli中，楊植麟表示目前處于測試階段，穩定后會向開發者提供框架。對于視覺編碼器大小問題，吳育昕稱小型編碼器有利于Scaling。對于是否推出帶原生音頻輸入功能的模型，楊植麟表示目前資源有限，可能重點放在訓練更好的智能體上。

更多>同類資訊

馬斯克透露SpaceX戰略轉向：優先登月，10年內或建月球可擴張城市

02-10

特斯拉電動卡車Semi大批量生產提上日程馬斯克再確認年內投產

02-10

馬斯克調整太空探索重心：10年內建月球城市，火星計劃稍后推進

當地時間2月8日，馬斯克在社交平臺X發帖稱，“SpaceX已經將重心轉移至在月球上建造一座可自我擴張的城市上，因為我們有望在10年內實現這一目標，而前往火星則需要20年以上。” 此前據財聯社2月8日消息，馬斯…

02-10

馬斯克：月球建城或十年內實現，火星計劃暫緩優先保“文明未來”

2月10日消息，當地時間2月8日，美國知名企業家埃隆·馬斯克在社交媒體X平臺透露，其名下的太空探索技術公司（SpaceX）已將戰略重點轉向在月球建造一座“自我生長的城市”，且這一目標有望在不到10年的時間里成…

02-10

阿里豪擲30億請喝奶茶：AI拉新“奶茶戰”，是突圍捷徑還是商業幻夢？

02-10

李亞鵬“帶貨一哥”正火卻停播：投身公益，流量與善舉如何共舞？

02-10

年貨市場熱潮涌動快遞物流全力以赴保障年貨“一路暢行”

02-10

草根逆襲：從銷售員到AI PCB龍頭，陳濤憑兩次抉擇鑄就2000億傳奇

02-10

阿里“奶茶攻勢”拉新：30億補貼能否為千問鋪就AI突圍之路？

02-10

谷歌Aluminum OS新動向：Gemini深度集成，Google鍵+空格開啟智能新體驗

02-10

特斯拉法國可靠性排名逆襲登頂豐田讓位車輛問題少獲認可

02-10

假廣告引發熱議：OpenAI首款硬件產品究竟藏著什么秘密？

02-10

阿里達摩院RynnBrain開源：推倒具身智能“智力高墻”，加速產業進化

02-10

70邁黑冰糖A400 Pro行車記錄儀京東上架，大廣角+智能WDR，169元起售

02-10

理想L9煥新出擊：李想押注具身智能，能否重奪市場高地？

02-10

點擊查看更多 +

全站最新

港股收評：Seedance2.0引爆！AI應用股大漲，影視股走強

特朗普定“KPI”！沃什要帶美國GDP沖15%？

預售破億！春節檔票房大戰打響，哪些公司將受益？

稀缺的邊端側AI芯片標的，愛芯元智(0600.HK)正式上市迎來價值重估

濱江集團(002244.SZ)：競得土地使用權

K線暫歇，溫情歸位：2026年春節休市指南

熱門內容

本欄最新

字節Seedance2.0內測調整：暫停真人人臉參考平衡創新與安全責任

大曉機器人獲螞蟻集團領投天使輪融資，以創新范式推動具身智能產業新發展

新一代小米SU7升級亮點多：續航提升、電機換新、智駕與舒適性再進階

小米YU7現身美加州公路引猜測，雷軍回應：暫無進軍美國市場打算

小米YU7 GT賽道版來襲！雙電機爆1003馬力，3秒破百極速300km/h

雷軍微博發聲：小米汽車短期無赴美計劃，SU7換代款4月將上市

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

月之暗面聯創凌晨3小時AMA：回應23問，楊植麟透露Kimi K3將大幅升級