时间: 2025-01-24 16:53:31 | 作者: 米乐体育app官网通用版
继大语言模型价格以厘计算之后,视觉理解模型也宣告进入“厘时代”。在12月18日举办的火山引擎 Force 大会上,字节跳动正式对外发布豆包视觉理解模型,为公司可以提供极具性价比的多模态大模型能力。
据了解,豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格实惠公道85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁谭待表示,豆包大模型虽然发布较晚,但一直在快速迭代进化,目前已成为国内最全面、技术最领先的大模型之一。
研究显示,人类接受的信息超过80%来自视觉。视觉理解将极大地拓展大模型的能力边界,同时也会降低人们与大模型交互的门槛,为大模型解锁更丰富的应用场景。
谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。
此前,豆包视觉理解模型已经接入豆包App和PC端产品。豆包战略研究负责人周昊表示,豆包一直在努力让用户的输入更快更方便。为此,豆包产品很注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。
会上,豆包3D生成模型首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。
豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。
即梦Dreamina张楠认为,生成式AI技术能把每个人脑子里的奇思妙想快速视觉化,“像做梦一样”。即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。
大会透露,2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。
截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。大模型应用正在向各行各业加速渗透。
据悉,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。
与企业生产力相关的场景,豆包大模型也获得了众多企业客户青睐:最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。
谭待认为,豆包大模型市场占有率的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家公司都能用得起、用得好的普惠科技。
会上,火山引擎宣布火山方舟、扣子和 HiAgent 三款平台产品升级,以帮企业更好地构建自身的 AI 能力中心,高效开发 AI 应用。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。
云原生是过去十年最重要的计算范式,大模型时代则推动着云计算的变革。火山引擎认为,下一个十年,计算范式应该从云原生进入到AI云原生时代。
谭待表示,“今年是大模型快速地发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族,火山引擎希望帮企业做好AI创新,驶向更美好的未来。”(战钊)
冰岛基因解码公司科学家完成了一项重要研究。他们绘制了一份人类基因组完整改组图谱,即详尽的人类DNA在生殖过程中混合方式的地图。
考古人员在位于湖南省常德市澧县城头山镇的李家岗遗址,发现彭头山文化时期“古稻田”遗迹,这将长江中游早期稻田的出现时间提早到距今8000多年。
日前国际学术期刊《大气科学进展》上发布2024年全球海温变化研究报告:2024年全球海表平均温度、海洋上层2000米热含量再一次达到了人类有观测记录以来的最高值。
日前,新疆农业大学科研人员李德强所在的开发团队研发出一种新型可注射水凝胶,并将其用于抗癌药物的负载,可明显降低药物副作用。
呼吁更多的人转变观念,认识到从“能用”到“多用”再到“好用”的国内装备自主可控,对于面临复杂多变的国际环境意义重大。
记者21日从中国有色金属工业协会获悉,2024年我国规模以上有色金属企业工业增加值同比增长8.9%,十种有色金属总产量7919万吨,比上年增长4.3%。其中,精炼铜、电解铝产量分别达1364万吨、4400万吨,同比增长4.1%、4.6%。
《自然·医学》杂志21日发表的一项研究报告称,一种手术植入的脑机接口系统能通过精准侦测和解码瘫痪患者的神经元活动,转为“手指动作”,使其可在电子游戏中自如驾驶虚拟四轴飞行器。
近日,美国加州大学洛杉矶分校教授李健带领团队开展的一项研究之后发现,工作所承受的压力正在成为许多“打工人”的睡眠质量“隐形杀手”。
华南理工大学机械与汽车工程学院教授林容周团队与合作者提出了一种新的软电子制造方法——粒子吞噬打印。
复杂的人体系统内,细胞活动时时刻刻都在进行:运输氧气、吞噬细菌、传递神经信号……要想保证这些细胞各司其职、井然有序,离不开一位特殊的“指挥官”——非编码小RNA(核糖核酸)。
日前,中央、国务院发布了《关于深化养老服务改革发展的意见》,指出要“加快养老科技和信息化发展应用”“重点推动人形机器人、脑机接口、人工智能等技术产品研制应用”。
经过数月的延迟,寒冷的拉尼娜气候模式终于出现在热带太平洋东部。虽然它降低了全球平均气温,但也增加了部分地区出现干旱和强降雨的风险。
中国科学院古脊椎动物与古人类研究所副研究员江左其杲及其所在团队,与中国科学院动物研究所副研究员李欣海及国外合作者,从欧亚大陆别的地方的大量豹属化石记录中识别出了稀有的雪豹化石记录,从而揭示了雪豹特殊的演化之路。相关论文近日发表于《科学进展》。
来自美国亚利桑那大学的天文学家团队使用大型双筒望远镜干涉仪,在红外波段捕捉到了迄今为止最清晰的活动星系核(AGN)图像,并将研究结果发表在最新一期《自然·天文学》杂志上。
20日,记者从中国科学院合肥物质科学研究院获悉,位于合肥“科学岛”上的全超导托卡马克EAST装置取得重大成果,成功实现了上亿度1066秒稳态长脉冲高约束模等离子体运行,再次创造了托卡马克装置高约束模运行新的世界纪录。
“雪蘑菇”是在地表突出物体上,拥有较强黏性和附着力的雪花层层累积而形成的,主要出现在水汽充足、降雪量较多的地区。
美国互联网科技公司Meta的研究人员开发了一种机器学习系统,几乎能立即将101种语言的语音翻译成36种目标语言中的任意一种。
1月16日,国际小行星中心公布了一颗由中国科学院紫金山天文台发现的新彗星,并将其命名为C/2025 A3。
中国中医科学院望京医院教授、中国工程院院士朱立国团队近日在椎间盘退变研究领域取得重要突破。
今年上半年,2025北京亦庄半程马拉松暨人形机器人马拉松将举办,人形机器人将与运动员共跑“半马”,挑战人类速度。
辽宁黑山县二手化学制品超微磨粉机?
韦瑞德机械-巩义橡胶粉碎机厂家废旧轮胎橡胶磨粉机的报价?
长沙县二手油性物料超微磨粉机报价?
贵州安龙县二手油性物料超微磨粉机?
张掖二手化学制品超微磨粉机价格?
2023年角钢十大品牌排行榜?