課程介紹
本課程聚焦AI大模型(尤其是多模態技術)在電信質調場景的落地實踐,結合中國電信行業最新趨勢(如星辰大模型、息壤平臺等),通過技術架構解析+行業案例復盤+代碼實操,幫助技術骨干掌握語音分析、多模態模型部署及解決方案設計能力,滿足政企客戶智能化轉型需求。
培訓對象
從事相關工作及對課程內容感興趣的人員。
課程收益
掌握多模態技術架構(Gemini、九天、星辰)及電信行業落地方法論;
學習語音分離、長音頻摘要生成等核心技術,并完成Pipeline搭建實戰;
熟悉DeepSeek等工具鏈,設計電信級AI解決方案(如客服質檢、故障工單分析);
獲取多模態模型部署優化方案(MoE/CoE架構、息壤平臺)與電信專屬案例庫。
知識概要
-- 多模態技術基礎與語音提取實戰;
-- 多模態生產部署與DeepSeek開發。
課程大綱
多模態架構與電信應用場景
多模態技術演進與運營商布局
原生多模態架構對比(Gemini/GPT-4o vs. 九天/星辰)
本地化部署(中國電信星辰視覺日均調用6億+案例解析)
多模態在電信場景的應用
智能客服(多模態意圖識別)
視頻布控(圖像+文本聯動)
會議分析(語音+字幕聯合分析)
語音處理技術棧解析
語音分離(FRCRN/MossFormer)
方言識別(CT-Transformer)
超自然語音生成(VITS框架)
語音內容提取解決方案實戰
行業方案:長音頻內容提取
LeMUR框架實踐(10小時錄音→摘要/問答/行動項)
安徽電信自服務智能體案例
行業方案:降噪與說話人分離
ClearerVoice-Studio實戰(復數域算法+實時處理)
電信客服場景應用(投訴分類、情緒識別)
開發實戰:語音提取Pipeline搭建
從音頻上傳→ASR(Whisper)→關鍵信息結構化(NLP實體抽取)
代碼實操與調試
模型部署與前后端開發
大模型生產部署方案
算力調度(息壤平臺)
模型蒸餾(Distil-BERT)、MoE/CoE架構優化(降低推理成本30%+)
前后端數據鏈路開發
前端語音采集(PyAudio)+后端AI能力集成(FastAPI+TensorRT)
電信級低延遲方案設計
電信級解決方案設計
質調場景:客服錄音分析(情緒識別+關鍵詞提取)
故障語音工單提取(聲紋識別+文本生成)
DeepSeek與綜合應用
DeepSeek-R1全解析
模型架構(Mixture-of-Experts)
微調(LoRA)
智能體編排
多模態綜合應用案例
政務熱線(語音→工單自動生成)
應急指揮(視頻+語音聯動決策系統)
結業設計
分組輸出:質調中心語音質檢AI方案(含技術選型/架構圖)
導師點評與優化建議
認證過程
無認證考試
開班信息
暫無開班信息