美图不想在文生视频领域和巨头们“硬碰硬” 火山引擎举办视频云科技原力峰会,发布面向全新视频云产品矩阵
美图不想在文生视频领域和巨头们“硬碰硬” 火山引擎举办视频云科技原力峰会,发布面向全新视频云产品矩阵,
美图不想在文生视频领域和巨头们“硬碰硬”
6月12日,美图公司(01357.HK)一口气发布及更新了6款产品,包括美图云修V2、开拍V2、美图设计室V3、站酷设计服务、奇觅及MOKI,覆盖商业摄影、游戏营销、视频生成等多个领域。
MOKI是该公司新发布的AI短片创作平台,主要辅助创作者制作动画短片、网文短剧、故事绘本和MV。该平台将于7月31日推出。
据界面新闻了解,目前美图产品所需的AI模型能力,均由美图奇想大模型(MiracleVision)提供。该模型已迭代到V5版本,采用自研DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型。
美图公司创始人、董事长兼首席执行官吴欣鸿认为,AI应用将经历点、线、面三个阶段,美图正尝试把AI单点功能串联起来,以运用到电商、广告、游戏、影视、动漫等行业。 例如在MOKI上,输入一个简单的故事剧本后,模型可将短片操作流程进行结构化拆解,然后生成短片。
这并非美图首创。早在今年2月,OpenAI发布的Sora便在文生视频领域掀起了一轮巨浪,此后有多家大模型相关公司跟进。但美图方面表示,用类似的文生视频模型辅助内容创作,故事成片难,可控性较差。
在吴欣鸿看来,文生视频领域涉及蒙太奇等多种剪辑效果,可控性远比时长更重要,它意味着AI需要完成各种各样的复杂工作。
文生视频的另一难题还在于,用户输入一整篇小作文才能输出短片,且要考虑场景、人物、运动轨迹以及各种精细化的视频内容呈现。但现实情况是,很多内容难以用文字去描述清楚。
即便Sora仍有种种不足,要在短期内追上它的技术能力和生成效果并不容易。对此,美团的策略是“不在模型侧一味硬碰硬”。
吴欣鸿指出,如果在文生视频领域“硬刚”,其竞争对手会是全球巨头。无论在资金投入还是算法层面,美图与巨头们都存在一定差距。但在应用层,该公司希望通过提供一站式的内容创作方案来抢占更多市场。
为了能更好地“控制”其应用,这家公司选择自研大模型。“如果我们用外部API或者开源大模型,很难在底层进行深度开发。 ”吴欣鸿向界面新闻表示,目前AI技术领先于AI应用,将AI概念转化为优秀产品的并不多。
不少大模型公司都在追求参数量、打榜,以证明自己的技术实力和资金投入,背后却是高昂的成本,以及由此带来的商业化挑战。
美图试图在投入和盈利之间寻求平衡。“搞模型军备竞赛不是美图的核心战略,我们会在保证应用竞争力的前提下,控制模型的投入。”他还强调,过去很长时间美图都是常年亏损,所以会更看重落地场景和商业模式。”
吴欣鸿认可“模型即应用是大趋势”,也注意到国内很多大模型公司都在往应用方向走,或快或慢。他相信应用会是十倍于模型本身的市场空间。
从此次发布的产品可知,这家公司有意回归最为熟悉的影像领域,且正在设法争取更多企业用户。
近年来,其曾做过多元化尝试,涉足手机制造、电子商务、金融科技等领域,但频频受挫。当下着力的AI应用,也同样面对来自字节跳动、腾讯、快手等大型互联网公司,以及新晋大模型独角兽们的围追堵截。
该公司2023年财报显示,其企业端业务收入为5.7亿元,占总营收的21%,消费端业务占比近50%,营收达13.3亿元。企业端要超过消费端营收,美图仍有很长的一段路要走。
截至6月12日收盘,美图公司收盘价为2.78港元,下跌9.74%,总市值126.08亿港元。
火山引擎举办视频云科技原力峰会,发布面向全新视频云产品矩阵
2月25日,火山引擎主办的视频云科技原力峰会在北京举行。峰会以“乘云·瞰世界””为主题,火山引擎相关负责人分享了对视频体验、交互、增长的观察与思考,并发布面向体验的视频云全新产品矩阵。
全行业视频化 极致视频体验成业务增长关键
据IDC发布的《视频云发展趋势洞察》,数字化时代,从商业活动到社会生活,视频数据已经成为连接个人、家庭、社区乃至社会的重要纽带。
IDC中国研究经理魏云峰表示,伴随5G、AI、4K/8K等技术的发展,车联网、物联网、视联网使音视频应用从传统视频场景,逐渐扩展至车载视频、智能家居等全新应用场景,全行业视频化的趋势已经形成。
在此背景下,终端用户对音视频技术的要求进而开始强调高清化、交互式、沉浸式的全方面体验。
对不同行业来说,打造优质的用户体验也因行业属性的差异而有所不同。广电传媒行业的需求更偏向于自动化的内容生产制作,而零售电商行业则更看重视频的流畅与互动性,可以说,各行各业对视频体验的需求贯穿了视频生产制作、视频存储、视频分发甚至是终端/应用视频流化全流程。
图:火山引擎总经理谭待致辞
火山引擎总经理谭待表示,火山引擎通过抖音、西瓜视频、番茄小说、飞书等产品沉淀出优秀的能力,包括视频点播、视频直播、实时音视频、边缘计算、veImageX等产品,能够满足客户对视频能力建设的要求。
据了解,火山引擎视频云包含泛互联网、游戏、金融、广电等场景及解决方案,视频点播、veImageX、实时音视频等核心产品,以及传输网络、智能生产、智能处理等中台支撑服务。
除此之外,火山引擎视频云还支持虚拟偶像演唱会、数字替身Avatar、一起看抖音等实用功能。虚拟偶像演唱会支持与虚拟偶像主播进行实时互动,为观众带来跨次元沟通的全新体验;数字替身Avatar支持设置虚拟人形象在社交平台上互动,可降低创作成本,增加内容吸引力;一起看抖音功能支持房间内的所有用户,观看相同播放进度的抖音短视频,增强房间趣味性,营造陪伴感。这些趣味创新玩法,都可以在实际应用中为企业的用户增长助力。
设立量化指标,打造面向体验的视频云
“面向体验”是火山引擎视频云的一大特色。火山引擎视频云技术负责人表示,要想评估和提高体验,第一步是要能够量化体验,“我们需要准确的指标作为指北针,精准反映体验优化与业务数据之间的关系,往对的方向优化,才能不断提高体验。”
火山引擎从播放、画质、互动、性能四个维度,量化和评估视频体验。
在播放体验方面,火山引擎视频云将首帧时间压缩到100ms以下,用户感觉不到首帧存在。且相关技术有着更高的稳定性,崩溃率降低到了1/100000以下,假如用户每天刷100个短视频,3年才能遇到一次播放器崩溃。
画质体验方面,火山引擎BVC1编码器相比H265能够节省50%的码率,在同样的带宽下BVC1编码器的画质更清晰。据悉,在画质上火山引擎投入了很多的研发资源,在视频编解码全球顶级赛事MSU2020中,火山引擎研发的BVC系列编码器获得17项评分冠军。而为了量化画质,火山引擎自研的VQScore算法,也在ICME 2021 的“压缩UGC视频质量评估”比赛中,获得“无参考视频质量评价(NR-VQA)MOS赛道”第一名。
互动体验方面,火山引擎视频云集成了抖音美颜、特效、滤镜应用的最佳实践,让视频生产更简单,让用户互动更有趣。另外,实时音视频服务(RTC技术)支持百万级用户并发,单房间最高支持超过千人上麦,成为国内首家能够提供单房间超过千人上麦的RTC服务。
性能体验方面,火山引擎视频云可针对业务场景提供SDK参数配置、码率配置的最佳实践,极大提高H265的播放占比;其自研的图像编解码算法效果更优,压缩体积相比行业主流产品能再优化10%-20%;同时,高清低码技术使得片源压缩率可达20%-35%,相同主观效果下,可节省码率10%-20%。
图:火山引擎联合阿里云、腾讯云发布超低延时直播信令标准
发布于:广西?
- 下周四立冬,提醒中老年:3不做,2不吃,忌1事,迎冬接福气 十月初一寒衣节,别忘“吃3样,做1事”,遵循传统,为家人祈福纳吉
- 新年寻“沪味”,如何激活上海年菜经济? 重审人贩子余华英,“梅姨案”有新消息,孩子走失如何报警?
- 冰毒是如何从军需药品发展成为新一代毒品之王的? 新中国成立75周年 | 看杭州9大改革,如何改变我们的生活
- 入冬必备小零嘴!吃葡萄干竟然有这么多讲究,你真的吃对了吗? 月饼属于“三高”食品,今年中秋节这样吃更健康
- 好丽友燕麦曲奇亮相进博会,续写“零食营养+”无限可能 “天价”凤爪背后的市场博弈
- 西安市市场监督管理局关于4批次食品不合格情况的通告2024年第52号 重量为历届进博会之最!388公斤蓝鳍金枪鱼王亮相光明食品集团展台
- 100万个奥运手环订单从天而降!义乌又爆单了,商品越卖越“大”外贸新趋势 把二手衣服卖到非洲,广东小伙年入 4 亿
- 办公家具品牌推荐,圣奥办公家具荣耀入选 悍高集团双轮驱动全球户外家具市场,创新与品质共筑行业新高地