火山引擎发布大模子教训视频预惩处决策,已期骗于豆包视频大模子
发布日期:2024-10-16 06:36    点击次数:90

10月15日,火山引擎在视频云时期大会上发布了大模子教训视频预惩处决策,使模子能更高效地学习视频中的特征和常识,升迁教训后果和效能。当今,该时期决策已期骗于豆包视频生成模子。

据先容,对教训视频进行预惩处是保险大模子教训后果的进犯前提,不错和解视频的数据容貌、提高数据质地、终了数据程序化、减少数据量以及惩处标注信息。抖音集团视频架构负责东谈主王悦示意,对大模子厂商而言,上述进程中面对着诸多挑战。“领先,超大鸿沟视频教训数据集导致臆想和惩处资本激增,”王悦说,“其次是视频样本数据错落不皆,然后是惩处链路智商多、工程复杂,临了还面对着对GPU、CPU、ARM等多种异构算力资源的退换部署。”

借助Intel的CPU、GPU等不同资源,火山引擎这次发布的大模子教训视频预惩处决策依托于自研的多媒体惩处框架BMF,能灵验猛烈模子教训的算力资本挑战。此外,该决策还在算法和工程方面进行了调优,不错对海量视频数据高质地预惩处,短时期内终了惩处链路的高效协同,提高模子教训效能。值得一提的是,火山引擎本次还发布并开源了转移端后处联贯决决策BMF lite版块。BMF lite扶植端侧大模子接入和算子加快,愈加轻量、通用。

这次当作中,火山引擎还发布了跨讲话同声复刻直播决策、多模态视频联贯与生成决策、对话式AI及时交互决策和AIG3D&大场景重建决策。比如依托豆包大模子和火山引擎视频云自研的多项算法,火山引擎为用户提供了智能对话和当然讲话惩处的弘大才智,可终了毫秒级东谈主声检测和打断反应,以及丝滑结识的端到端反应体验。

王悦还知道了字节自研视频编解码芯片的最新进展,经过抖音集团里面的扩充考据,该芯片在同等视频压缩效能下,资本大概了95%以上,还在2024MSU全国编码器大赛中一举夺得最好ASIC编码器。王悦示意,该芯片将于近期阐明对外通达测试,招募首批种子用户,共同探索生意价值的可复制性。

文/北京后生报记者 温婧

裁剪/郊野



热点资讯
相关资讯