【時間】2025年3月13日(周四)下午14:30 開始
【地點(diǎn)】線下講座,9B406會議室
【主題】面向視覺大模型的多任務(wù)混合推理優(yōu)化技術(shù)
【主講人及介紹】
吳加其博士,2019年在廣西大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院獲得碩士學(xué)位,2020年入學(xué)哈爾濱工業(yè)大學(xué)(深圳)電子與信息工程學(xué)院。主要從事網(wǎng)絡(luò)通信、人工智能、博弈論和經(jīng)濟(jì)學(xué)交叉學(xué)科研究工作。研究成果發(fā)表國際期刊和會議論文多篇。
【內(nèi)容簡介】
隨著通用人工智能的飛速發(fā)展,視覺大模型因其能夠根據(jù)用戶指令生成高質(zhì)量的視覺內(nèi)容,正逐漸成為研究熱點(diǎn)。然而,在資源受限的邊緣計算網(wǎng)絡(luò)中,如何高效地進(jìn)行視覺大模型任務(wù)的推理成為亟待解決的問題。本報告首先介紹了視覺大模型的現(xiàn)實(shí)應(yīng)用與底層模型架構(gòu),分析了其面臨的主要挑戰(zhàn)。其次,研究了如何選擇合理的推理步數(shù),并在質(zhì)量、時延與能耗之間實(shí)現(xiàn)有效的權(quán)衡,從而設(shè)計出獨(dú)立推理優(yōu)化方案。最后,報告探討了如何利用不同用戶之間的意圖相似性進(jìn)一步優(yōu)化推理流程,減少資源消耗,提出了混合推理優(yōu)化方案,以實(shí)現(xiàn)更高效的資源調(diào)度與推理處理。
誠摯歡迎廣大師生參加。