当前标签

模型

全球首个类 Sora 开源复现方案来了!全面公开所有训练细节和模型权重

全球首个开源的类 Sora 架构视频生成模型,来了!整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。这就是刚刚发布的 Open-Sora 1.0。它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。还能用航拍视角,展现悬崖海岸边,海水拍打着岩石的画面。亦或是延时摄影下的浩瀚星空。自

李开复:目前最好的大模型智能已达人类平均智力水平三倍

IT之家 3 月 18 日消息,据新浪科技报道,今日举行的 2024 澜舟科技大模型技术和产品发布会期间,澜舟科技宣布与创新工场董事长李开复创立的零一万物达成战略合作。创新工场董事长、零一万物 CEO 李开复在今天的活动中表示,大模型的智力水平在两年前就已经比普通人水平“好一点”,而在目前,世界上最

首个自主完成人类任务机器人出现,五指灵活速度超人,大模型加持虚拟空间训练

【新智元导读】Sanctuary AI 发布了世界第一个能够以人类的速率自主完成任务的机器人,他们通过在远程控制机器人操作获取数据,在虚拟空间训练,完成了这一壮举。这周,由 OpenAI,微软,贝索斯,英伟达投资的机器人公司 Figure AI 融资接近 7 亿美元,号称在 1 年之内要做出等独立行

阿里巴巴 CEO 吴泳铭:通义千问正释放基础大模型能力,加快追赶 GPT

IT之家 3 月 10 日消息,阿里巴巴集团 CEO、阿里云智能董事长吴泳铭近日在《中国网信杂志》撰文称,作为国内基础大模型的代表之一,通义千问正加快追赶 GPT-4,并把基础大模型能力释放出来。吴泳铭表示,AI 大模型将开启全新的智能时代,引发人机交互、计算范式和认知协作三场革命,通过开放 AP

业内首个物流智能联盟成立,以大模型助力物流行业增效降本

IT之家 3 月 7 日消息,IT之家从阿里云官方公众号获悉,今日,物流行业内首个专注于大模型应用研究与实践的联盟“物流智能联盟”在杭州成立,旨在加速大模型在物流领域落地,用 AI 助力物流行业增效降本和业务创新。据悉,该联盟由中国物流与采购联合会、阿里云、菜鸟、高德地图、中远海运、东航物流、圆通

华为云盘古大模型通过金融大模型标准符合性验证,官方称行业首批、最高等级

IT之家 3 月 4 日消息,华为中国官微今日宣布,去年 12 月,在由中国信通院组织的可信 AI 大模型标准符合性验证中,华为云盘古大模型顺利完成金融大模型标准符合性验证,并获得“优秀级”(4 + 级)评分。官方表示,这也是本次金融大模型评测各厂商中的最高等级。据悉,华为云盘古大模型成为首批通过金

汤姆猫:正在推进申请接入 OpenAI 的 Sora 模型

IT之家 3 月 3 日消息,汤姆猫今日在互动平台表示,公司正在推进申请接入 OpenAI 的 Sora 模型,并计划进行相关的素材制作的测试,目前暂未正式接入 Sora。在生成视频领域,公司已利用 Pika、Runway、Stable Diffusion 等工具制作了部分视频素材,探索该等素材在营

【IT之家评测室】usmile 笑容加数字牙刷 Y20 体验:AI 算法小模型 + 骨传导,会说话的数字牙刷

【IT之家评测室】usmile 笑容加数字牙刷 Y20 体验:AI 算法小模型 + 骨传导,会说话的数字牙刷 尽管电动牙刷已经成为现代生活中的必备品,但仅仅拥有一台电动牙刷并不意味着就能拥有科学、合理的刷牙习惯。为了更好地满足用户的健康需求,usmile 笑容加于去年 9 月份推出了双面屏数字牙刷

蚂蚁集团推出 20 亿参数多模态遥感基础模型 SkySense

IT之家 2 月 28 日消息,蚂蚁集团宣布推出 20 亿参数多模态遥感基础模型 SkySense,支持文本、红外光、可见光、SAR 雷达等多种模态,支持多分辨率的时序遥感影像建模,可用于地貌、农作物观测和解译等,有效辅助农业生产和经营。据介绍,研发人员蚂蚁百灵大模型多模态能力,使用内部构建的 19

字节跳动发布文生图开放模型 SDXL

IT之家 2 月 23 日消息,据界面新闻报道,从知情人士处获悉,字节跳动发布了文生图开放模型 SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。文生图是一种利用人工智能技术,根据文本描述生成图像的技术。目前,文生图领域的主流模型都采

微软提出模型稀疏化新方法:单 GPU 就能压缩模型,性能不变参数少 25%

大语言模型之大,成本之高,让模型的稀疏化变得至关重要。众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。今天要介绍的 SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练

亚马逊开发出有史以来最大的文本转语音模型,展现“涌现能力”

IT之家 2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回

大模型驾车哪家强?普渡研究给指南:GPT

现在一句口令,就能指挥汽车了。比如说声“我开会要迟到了”“我不想让我朋友等太久”等等,车就能理解,并且自动加速起来。如果这次行程有不满意的,只需要给汽车提供反馈建议:“要在充分保障安全的前提下”,汽车的自动驾驶行为就会在下次行程中进行自我修正。这是来自普渡大学数字孪生实验室最新研究 —— 让大语言模

AI 取代人类从网购 / 刷短视频开始:CMU 发布多模态 Web Agent 基准,让大模型冲浪比你还溜

大模型的新考验来了!近日,来自卡内基梅隆大学的研究人员发布了评估 LLM 多模态 Web 代理性能的基准测试。大模型(LLM)的多模态和 Agent 能力被做成基准测试了!以后哪个 LLM 再掌握不了多模态,干不了 Agent,都不好意思出门了。近日,来自卡内基梅隆大学(CMU)的研究人员发布了一个

苹果展示 AI 新模型 MGIE,可一句话精修图片

IT之家 2 月 8 日消息,相比较微软的风生水起,苹果公司在 AI 领域的布局显得低调很多,但这并不意味着苹果在该领域就没有丝毫建树。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat 与 Midjourney 合作制作MGIE

阿里大模型“通义千问”推出春节新功能:生成全家福写真

IT之家 2 月 5 日消息,春节将至,通义千问 App 推出多项免费新功能,例如拜年、画龙、创作春联、拍全家福等等。IT之家获悉,在“通义照相馆”,用户上传自己和家人的照片,就可以生成风格多样的全家福写真。通义照相馆提供了千里江山、国风东方、时光回忆、唐宫夜宴、书香工笔等 12 套经典风格写真模

自动驾驶大模型,千万别入戏太深

美国的 CES 展,长久以来都是人们观察全球科技风向的一个重要风向标。在 2024 年的 CES 展上,两位人工智能领域的专家,李飞飞和吴恩达做了一场对谈,在这场谈话中,他们提及了一个足以影响自动驾驶行业的关键点。那就是,AI 大模型开始从“大语言模型”向“大视觉模型”的转变,AI 大模型不但能理解

史上首个 100% 开源大模型重磅登场:破纪录公开代码 / 权重 / 数据集 / 训练全过程,AMD 都能训

史上首个 100% 开源大模型重磅登场:破纪录公开代码 / 权重 / 数据集 / 训练全过程,AMD 都能训 艾伦人工智能研究所等 5 机构最近公布了史上最全的开源模型「OLMo」,公开了模型的模型权重、完整训练代码、数据集和训练过程,为以后开源社区的工作设立了新的标杆。多年来,语言模型一直是自然语

台湾地区医院开发检测咽喉癌 App:基于英特尔 AI 大模型,只需张嘴“啊”2

IT之家 1 月 30 日消息,英特尔官方发文,中国台湾地区医院开发了一款检测咽喉癌的 App,用户只需打开 App 对着手机张嘴说“啊”,持续 2-3 秒,AI 便会通过基于英特尔的硬件和软件,将声音质量与大量经过训练的数据进行比较,并通过其他复杂算法运行结果。结果(准确率超过 80%)会在录制

从 20 亿数据中学习物理世界,基于 Transformer 的通用世界模型成功挑战视频生成

建立会做视频的世界模型,也能通过 Transformer 来实现了!来自清华和极佳科技的研究人员联手,推出了全新的视频生成通用世界模型 ——WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序列生视频等。据团队介绍,通过预测 Token

OpenAI 连更 5 款模型:修复 GPT

IT之家 1 月 27 日消息,OpenAI 近日发布新闻稿,在更新 GPT-4 Turbo 预览模型之外,还下调 API 调用价格,优化现有模型性能,并发布全新嵌入性模型。OpenAI 今天一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5

中国电信中部智算中心在武汉投运,支持部署万亿参数大模型

IT之家 1 月 27 日消息,中国电信中部智算中心在武汉东湖新技术开发区(光谷)举行正式投入运营。中国电信专家介绍,该智算中心的算力、安全、环保及扩展性均达到一流水平,目前在中部地区属于最高等级。IT之家注意到,中国电信中部智算中心建设先进自主液冷智算集群,首次采用基于国产 AI 基础软硬件平台的

几何纹理重建新 SOTA!浙大提出 SIFU:单图即可重建高质量 3D 人体模型

【新智元导读】最近来自浙江大学 ReLER 实验室的研究人员提出 SIFU 模型,一种侧视图条件隐函数模型用于单张图片 3D 人体重建。模型通过引入人体侧视图作为先验条件,并结合扩散模型进行纹理增强,在几何与纹理重建测试中均达到 SOTA,并且在真实世界中具有多种应用场景。在 AR、VR、3D 打印

小米申请注册“ChatMI”“小米大模型”商标,用于智能音箱、电动汽车等

IT之家 1 月 17 日消息,近日,小米科技有限责任公司申请注册科学仪器类“ChatMI”商标、运输工具类“小米大模型”商标,当前商标状态均为等待实质审查。“ChatMI”商标商品 / 服务显示为:模拟对话用聊天机器人软件;用户可编程的未配置的类人机器人;可下载的计算机游戏软件;数字语音信号处理器

大模型伪装「潜伏特工」学会欺骗,OpenAI 劲敌重磅研究震惊马斯克

新智元报道编辑:编辑部【新智元导读】最近,Anthropic 的研究者发现:一旦我们教会 LLM 学会骗人,就很难纠正它了。它会在训练过程中表现得「人畜无害」,随后神不知鬼不觉地输出恶意代码!如果想要纠正它,它的欺骗行为只会更变本加厉。不要教 LLM 学会骗人!不要教 LLM 学会骗人!不要教 LL

可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG

IT之家 1 月 15 日消息,谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集,并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行了一系列评估研究。谷歌研究人员表示,由于过去没有能够评估大语言模型“出错概率”及“自我纠错能

“AI 算命”登上 Nature 子刊,Transformer 新模型“Life2vec”成功预测意外死亡

AI 真的可以用来科学地算命了!?丹麦科学家用全国 600 万人的公开数据训练了一个基于 Transformer 的模型,成功预测了意外死亡和性格特点。丹麦技术大学 (DTU) 的研究人员声称他们已经设计出一种人工智能模型,据说可以预测人们的生活中的重大事件和结果,包括每个人死亡的大致时间。文章在前

微信扫一扫

微信扫一扫
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close