AI初創(chuàng)企業(yè)TinyCorp近日宣布突破技術(shù)瓶頸,成功開發(fā)出適配Apple Silicon芯片的eGPU擴(kuò)展方案。該方案通過定制化硬件模塊與軟件驅(qū)動(dòng)的協(xié)同設(shè)計(jì),首次實(shí)現(xiàn)了將英偉達(dá)RTX 5060顯卡與M系列芯片Mac mini的物理連接,為蘋果生態(tài)引入高性能計(jì)算外設(shè)開辟了新路徑。
技術(shù)實(shí)現(xiàn)層面,該解決方案采用ADT-Link核心轉(zhuǎn)換芯片,通過雷靂接口協(xié)議重構(gòu)技術(shù),將Mac設(shè)備的物理接口轉(zhuǎn)換為標(biāo)準(zhǔn)PCIe總線。這種創(chuàng)新設(shè)計(jì)使數(shù)據(jù)傳輸帶寬達(dá)到雙向40Gbps(約5GB/s),有效滿足AI大模型推理等密集型計(jì)算任務(wù)的實(shí)時(shí)性要求。硬件模塊集成智能電源管理系統(tǒng),可自動(dòng)調(diào)節(jié)顯卡功耗與供電參數(shù),確保設(shè)備運(yùn)行的穩(wěn)定性。
針對(duì)macOS系統(tǒng)對(duì)第三方顯卡支持的技術(shù)壁壘,研發(fā)團(tuán)隊(duì)開發(fā)了基于Python的專用驅(qū)動(dòng)框架。該驅(qū)動(dòng)通過模擬ARM架構(gòu)下的硬件抽象層,使顯卡能夠繞過系統(tǒng)原生限制,直接調(diào)用CUDA核心進(jìn)行并行計(jì)算。測試數(shù)據(jù)顯示,在LLaMA3模型推理場景中,外接顯卡可使處理速度提升3.2倍,顯著優(yōu)于單純依賴神經(jīng)網(wǎng)絡(luò)引擎的方案。
需要特別說明的是,當(dāng)前版本的技術(shù)方案專注于計(jì)算加速場景。顯卡通過PCIe內(nèi)存映射機(jī)制被識(shí)別為專用計(jì)算單元,系統(tǒng)不會(huì)為其分配圖形顯示資源。這意味著用戶暫時(shí)無法通過該方案實(shí)現(xiàn)外接顯示器或游戲加速功能,但可完美支持Stable Diffusion文生圖、PyTorch深度學(xué)習(xí)框架等純計(jì)算應(yīng)用。
據(jù)內(nèi)部人士透露,該擴(kuò)展模塊已完成量產(chǎn)前測試,預(yù)計(jì)將于2024年第二季度正式投放市場。產(chǎn)品定價(jià)策略將聚焦專業(yè)開發(fā)者群體,首批供貨將優(yōu)先滿足AI研究機(jī)構(gòu)與影視后期制作公司的采購需求。技術(shù)團(tuán)隊(duì)表示,后續(xù)版本正在開發(fā)圖形輸出支持功能,有望通過固件升級(jí)方式逐步解鎖完整顯卡性能。











