
英伟达新 API 助力工业开发:在苹果 Vision Pro 头显中串流庞大 3D 模型
IT之家 3 月 19 日消息,英伟达正在举办的 GTC 开发者大会上,推出了一项全新的服务,帮助企业将 3D 应用中交互式通用场景描述(OpenUSD)串流到 Apple Vision Pro 混合现实头显中。该技术利用英伟达最新的 Omniverse Clouds API,使用英伟达 Graph
IT之家 3 月 19 日消息,英伟达正在举办的 GTC 开发者大会上,推出了一项全新的服务,帮助企业将 3D 应用中交互式通用场景描述(OpenUSD)串流到 Apple Vision Pro 混合现实头显中。该技术利用英伟达最新的 Omniverse Clouds API,使用英伟达 Graph
全球首个开源的类 Sora 架构视频生成模型,来了!整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。这就是刚刚发布的 Open-Sora 1.0。它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。还能用航拍视角,展现悬崖海岸边,海水拍打着岩石的画面。亦或是延时摄影下的浩瀚星空。自
IT之家 3 月 18 日消息,据新浪科技报道,今日举行的 2024 澜舟科技大模型技术和产品发布会期间,澜舟科技宣布与创新工场董事长李开复创立的零一万物达成战略合作。创新工场董事长、零一万物 CEO 李开复在今天的活动中表示,大模型的智力水平在两年前就已经比普通人水平“好一点”,而在目前,世界上最
IT之家 3 月 17 日消息,据谷歌官方新闻稿,谷歌近日推出了一项名为 Cappy 的模型打分框架,该框架以 RoBERTa 语言模型为基础,主要用于检测模型输出的内容,并为相关内容打分,之后相关分数将会作为参考基准让模型学习,从而让模型更聪明。▲ 图源 谷歌官方新闻稿(下同)此外,Cappy 框
IT之家 3 月 11 日消息,据外媒 SiliconANGLE 报道,由 Tenstorrent 创始人 Ljubisa Bajic 领导的 AI 芯片创企 Taalas 已收获两轮共计 5000 万美元(IT之家备注:当前约 3.6 亿元人民币)的融资,该公司目标为特定 AI 模型打造专用芯片。
【新智元导读】Sanctuary AI 发布了世界第一个能够以人类的速率自主完成任务的机器人,他们通过在远程控制机器人操作获取数据,在虚拟空间训练,完成了这一壮举。这周,由 OpenAI,微软,贝索斯,英伟达投资的机器人公司 Figure AI 融资接近 7 亿美元,号称在 1 年之内要做出等独立行
IT之家 3 月 10 日消息,阿里巴巴集团 CEO、阿里云智能董事长吴泳铭近日在《中国网信杂志》撰文称,作为国内基础大模型的代表之一,通义千问正加快追赶 GPT-4,并把基础大模型能力释放出来。吴泳铭表示,AI 大模型将开启全新的智能时代,引发人机交互、计算范式和认知协作三场革命,通过开放 AP
IT之家 3 月 8 日消息,印度政府宣布已批准国家级“IndiaAI 使命”项目,旨在实现“让 AI 在印度扎根”和“让 AI 为印度服务”两大目标,预算达 1037.192 亿卢比(当前约 90.13 亿元人民币)。据介绍,该项目将由数字印度公司(DIC)旗下的“IndiaAI”独立业务部门(
IT之家 3 月 7 日消息,IT之家从阿里云官方公众号获悉,今日,物流行业内首个专注于大模型应用研究与实践的联盟“物流智能联盟”在杭州成立,旨在加速大模型在物流领域落地,用 AI 助力物流行业增效降本和业务创新。据悉,该联盟由中国物流与采购联合会、阿里云、菜鸟、高德地图、中远海运、东航物流、圆通
Mac 用户,终于不用羡慕 N 卡玩家有专属大模型 Chat with RTX 了!大神推出的新框架,让苹果电脑也跑起了本地大模型,而且只要两行代码就能完成部署。仿照 Chat with RTX,框架的名字就叫 Chat with MLX(MLX 是苹果机器学习框架),由一名 OpenAI 前员工打
IT之家 3 月 4 日消息,人工智能创业公司 Anthropic 今日宣布推出其突破性的 Claude 3 系列模型,该系列大型语言模型 (LLM) 在各种认知任务上树立了新的性能标杆。Claude 3 系列包含三个子模型,分别为 Claude 3 Haiku、Claude 3 Sonnet 和
IT之家 3 月 4 日消息,华为中国官微今日宣布,去年 12 月,在由中国信通院组织的可信 AI 大模型标准符合性验证中,华为云盘古大模型顺利完成金融大模型标准符合性验证,并获得“优秀级”(4 + 级)评分。官方表示,这也是本次金融大模型评测各厂商中的最高等级。据悉,华为云盘古大模型成为首批通过金
IT之家 3 月 3 日消息,汤姆猫今日在互动平台表示,公司正在推进申请接入 OpenAI 的 Sora 模型,并计划进行相关的素材制作的测试,目前暂未正式接入 Sora。在生成视频领域,公司已利用 Pika、Runway、Stable Diffusion 等工具制作了部分视频素材,探索该等素材在营
IT之家 3 月 1 日消息,2 月份,usmile 笑容加带来了数字牙刷新品 Y20,据介绍,usmile 笑容加数字牙刷 Y20 搭载了智能 AI 算法小模型,会主动记录每一次刷牙行为,并生成个人刷牙数据库;同时也是笑容加首款骨传导数字牙刷产品。接下来,IT之家为大家带来 usmile 笑容加数
【IT之家评测室】usmile 笑容加数字牙刷 Y20 体验:AI 算法小模型 + 骨传导,会说话的数字牙刷 尽管电动牙刷已经成为现代生活中的必备品,但仅仅拥有一台电动牙刷并不意味着就能拥有科学、合理的刷牙习惯。为了更好地满足用户的健康需求,usmile 笑容加于去年 9 月份推出了双面屏数字牙刷
IT之家 2 月 28 日消息,据IT之家小伙伴投稿,魅族20 / Pro手机目前获推Flyme 10.5.0.0A稳定版更新,体积为162.08MB。▲ 图源 IT之家图赏:魅族 20 Pro据介绍,该更新主要为系统内置的Aicy 语音助手接入AI大模型,正在使用系列手机的小伙伴可以升级体验。I
IT之家2 月 28 日消息,魅族 21 系列推出了 Flyme 10.5.0.1A 稳定版系统,语音助手接入 AI 大模型,正在使用魅族 21 系列的小伙伴可以前去升级体验。本次系统更新主要内容整理如下:Aicy 语音语音助手小溪接入 AI 大模型,支持自然语言对话、文档总结、知识问答、出行规划
IT之家 2 月 28 日消息,蚂蚁集团宣布推出 20 亿参数多模态遥感基础模型 SkySense,支持文本、红外光、可见光、SAR 雷达等多种模态,支持多分辨率的时序遥感影像建模,可用于地貌、农作物观测和解译等,有效辅助农业生产和经营。据介绍,研发人员蚂蚁百灵大模型多模态能力,使用内部构建的 19
IT之家 2 月 27 日消息,近日,微软推出了升级版的 AI 伴侣 Copilot,其中新增了一项定制的 GPT 功能 ——“健身教练(Fitness trainer)”,可以帮助用户解答健身方面的问题。这一消息由 Copilot 负责人 Jordi Ribas 通过社交媒体平台 X 发布。Jor
扩散模型,迎来了一项重大新应用 —— 像 Sora 生成视频一样,给神经网络生成参数,直接打入了 AI 的底层!这就是新加坡国立大学尤洋教授团队联合 UCB、Meta AI 实验室等机构最新开源的研究成果。具体来说,研究团队提出了一种用于生成神经网络参数的扩散模型 p (arameter)-diff
IT之家 2 月 25 日消息,中兴手机今日宣布,今年中兴终端也将发布自研 AI 大模型,以及中兴首款 AI 旗舰终端。在中兴星云 OS 及 AI 大模型技术的加持下,中兴终端全场景智慧生态 3.0 亮相 MWC2024。从官方公布的预热图来看,中兴终端 AI 大模型应用架构包括智能场景、交互技术、
IT之家 2 月 23 日消息,据界面新闻报道,从知情人士处获悉,字节跳动发布了文生图开放模型 SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。文生图是一种利用人工智能技术,根据文本描述生成图像的技术。目前,文生图领域的主流模型都采
IT之家 2 月 23 日消息,谷歌今天发布新闻稿,宣布自 Chrome 122 浏览器版本开始,邀请 Mac 和 Windows PC 用户体验全新的“Help me write”功能。“Help me write”最初是 Gmail 中的 AI 辅助功能,在 2023 年的 I / O 开发者大
IT之家 2 月 23 日消息,据IT之家网友反馈,华为 P50 Pro 手机现已开启小艺大模型版众测,版本号为 12.1.1.400,大小为 65MB,日期为 2024/2/20-2024/3/31。据官方介绍,搭载了大模型能力的智慧助手小艺能够完成更复杂的任务。众测期间可体验文案辅助创作能力、
【新智元导读】谷歌 Research Lead,负责 VideoPoet 项目的蒋路,即将加入 TikTok,负责视频生成 AI 的开发。谷歌 VideoPoet 项目 Research Lead,CMU 兼职教授蒋路的 Google Scholar 资料显示已加入 TikTok。最近,有传闻 Ti
IT之家 2 月 21 日消息,据谷歌官方新闻稿,谷歌 DeepMind 团队今天推出一款Gemma开放模型,该AI模型号称受到 Gemini 启发,提供 Gemma 2B 和 Gemma 7B 两种规模版本可选。▲ 图源 谷歌官方新闻稿(下同)IT之家注意到,这款 Gemma 模型可以使用 Ker
大语言模型之大,成本之高,让模型的稀疏化变得至关重要。众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。今天要介绍的 SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练
IT之家 2 月 21 日消息,微软广告和网络服务部门 CEO Mikhail Parakhin 近日在推特与网友互动时表示,OpenAI 开发的视频生成器 Sora 将最终与 Copilot 集成,但需要一些时间。IT之家注意到,一位用户询问 Sora 是否会加入 Copilot,Parakhin
卷疯了!世界最快的大模型 Groq 一夜之间爆火,能够每秒输出近 500 个 token。如此神速的响应,背后全凭自研的 LPU。一觉醒来,每秒能输出 500 个 token 的 Groq 模型刷屏全网。堪称是世界上速度最快的 LLM!相比之下,ChatGPT-3.5 每秒生成速度仅为 40 个 t
IT之家 2 月 20 日消息,极越 CEO 夏一平今日于微博宣布,极越 01 车型的 1.3.1 版本将在 2 月底前对用户全量推送,国内第一家更新支持 OCC(Occupancy Network 占用网络技术)感知模型。在推送前,极越 CEO 夏一平将与百度自动驾驶技术委员会主席王亮直播分享 O
IT之家 2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回
现在一句口令,就能指挥汽车了。比如说声“我开会要迟到了”“我不想让我朋友等太久”等等,车就能理解,并且自动加速起来。如果这次行程有不满意的,只需要给汽车提供反馈建议:“要在充分保障安全的前提下”,汽车的自动驾驶行为就会在下次行程中进行自我修正。这是来自普渡大学数字孪生实验室最新研究 —— 让大语言模
基于大模型的 Agent 会玩宝可梦了,人类水平的那种!名为 PokéLLMon,现在它正在天梯对战中与人类玩家一较高下:PokéLLMon 能灵活调整策略,一旦发现攻击无效,立刻改变行动:PokéLLMon 还会运用人类式的消耗战术,频繁给对方宝可梦下毒,并一边恢复自身 HP。不过面对强敌,Pok
大模型的新考验来了!近日,来自卡内基梅隆大学的研究人员发布了评估 LLM 多模态 Web 代理性能的基准测试。大模型(LLM)的多模态和 Agent 能力被做成基准测试了!以后哪个 LLM 再掌握不了多模态,干不了 Agent,都不好意思出门了。近日,来自卡内基梅隆大学(CMU)的研究人员发布了一个
100 + 数据展示大模型用户全貌:ChatGPT 一年豪夺 1.8 亿用户,微软 Copilot 图文生成超 50 亿 国外网站 AIPRM 收集了 100 多项 ChatGPT 统计数据,考察了 ChatGPT 的增长、使用和公众意见等各项数据。上线一年多以后 ChatGPT 真的成茶叶蛋了吗?
IT之家 2 月 8 日消息,2 月 6 日,以“顶天立地 星火燎原”为主题的科大讯飞 2023-2024 年公司年会在中国科学技术大学举行。科大讯飞董事长刘庆峰及总裁吴晓如在内部演讲中,现场系统总结了科大讯飞 2023 年发展情况,并明确 2024 年发展目标。面向 2024 年,刘庆峰提出讯飞
IT之家 2 月 8 日消息,相比较微软的风生水起,苹果公司在 AI 领域的布局显得低调很多,但这并不意味着苹果在该领域就没有丝毫建树。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat 与 Midjourney 合作制作MGIE
IT之家 2 月 5 日消息,春节将至,通义千问 App 推出多项免费新功能,例如拜年、画龙、创作春联、拍全家福等等。IT之家获悉,在“通义照相馆”,用户上传自己和家人的照片,就可以生成风格多样的全家福写真。通义照相馆提供了千里江山、国风东方、时光回忆、唐宫夜宴、书香工笔等 12 套经典风格写真模
OpenAI 的 GPT 商店有开源平替了 —— 来自抱抱脸(Hugging Face)。它新推出的“Hugging Chat Assistant”,也瞄准了让用户免费制定自定义聊天机器人。是的,完全免费,无需像 OpenAI 那样不开会员就被拒之门外。除此之外,还有一个相当大的优势:支持各种开源模
美国的 CES 展,长久以来都是人们观察全球科技风向的一个重要风向标。在 2024 年的 CES 展上,两位人工智能领域的专家,李飞飞和吴恩达做了一场对谈,在这场谈话中,他们提及了一个足以影响自动驾驶行业的关键点。那就是,AI 大模型开始从“大语言模型”向“大视觉模型”的转变,AI 大模型不但能理解
史上首个 100% 开源大模型重磅登场:破纪录公开代码 / 权重 / 数据集 / 训练全过程,AMD 都能训 艾伦人工智能研究所等 5 机构最近公布了史上最全的开源模型「OLMo」,公开了模型的模型权重、完整训练代码、数据集和训练过程,为以后开源社区的工作设立了新的标杆。多年来,语言模型一直是自然语
IT之家 1 月 30 日消息,英特尔官方发文,中国台湾地区医院开发了一款检测咽喉癌的 App,用户只需打开 App 对着手机张嘴说“啊”,持续 2-3 秒,AI 便会通过基于英特尔的硬件和软件,将声音质量与大量经过训练的数据进行比较,并通过其他复杂算法运行结果。结果(准确率超过 80%)会在录制
建立会做视频的世界模型,也能通过 Transformer 来实现了!来自清华和极佳科技的研究人员联手,推出了全新的视频生成通用世界模型 ——WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序列生视频等。据团队介绍,通过预测 Token
IT之家 1 月 27 日消息,OpenAI 近日发布新闻稿,在更新 GPT-4 Turbo 预览模型之外,还下调 API 调用价格,优化现有模型性能,并发布全新嵌入性模型。OpenAI 今天一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5
IT之家 1 月 27 日消息,国外科技媒体 9to5Mac 深入挖掘 iOS 17.4 Beta 1 更新,苹果正在继续开发由大型语言模型技术驱动的新版 Siri,并借助 OpenAI 的 ChatGPT API 进行内部测试。根据代码信息,iOS 17.4 中包含名为 SiriSummariza
IT之家 1 月 27 日消息,中国电信中部智算中心在武汉东湖新技术开发区(光谷)举行正式投入运营。中国电信专家介绍,该智算中心的算力、安全、环保及扩展性均达到一流水平,目前在中部地区属于最高等级。IT之家注意到,中国电信中部智算中心建设先进自主液冷智算集群,首次采用基于国产 AI 基础软硬件平台的
IT之家 1 月 22 日消息,Stability AI日前发布新闻稿,公布了一款名为 Stable LM 2 1.6B 的 AI“小模型”,这是该公司今年推出的第二款模型,号称是“自家迄今以来最为强大的小语言AI模型”。IT之家从新闻稿中得知,这款AI模型支持英语、西班牙语、德语、意大利语、法语等
【新智元导读】最近来自浙江大学 ReLER 实验室的研究人员提出 SIFU 模型,一种侧视图条件隐函数模型用于单张图片 3D 人体重建。模型通过引入人体侧视图作为先验条件,并结合扩散模型进行纹理增强,在几何与纹理重建测试中均达到 SOTA,并且在真实世界中具有多种应用场景。在 AR、VR、3D 打印
IT之家 1 月 17 日消息,近日,小米科技有限责任公司申请注册科学仪器类“ChatMI”商标、运输工具类“小米大模型”商标,当前商标状态均为等待实质审查。“ChatMI”商标商品 / 服务显示为:模拟对话用聊天机器人软件;用户可编程的未配置的类人机器人;可下载的计算机游戏软件;数字语音信号处理器
新智元报道编辑:编辑部【新智元导读】最近,Anthropic 的研究者发现:一旦我们教会 LLM 学会骗人,就很难纠正它了。它会在训练过程中表现得「人畜无害」,随后神不知鬼不觉地输出恶意代码!如果想要纠正它,它的欺骗行为只会更变本加厉。不要教 LLM 学会骗人!不要教 LLM 学会骗人!不要教 LL
IT之家 1 月 15 日消息,谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集,并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行了一系列评估研究。谷歌研究人员表示,由于过去没有能够评估大语言模型“出错概率”及“自我纠错能
AI 真的可以用来科学地算命了!?丹麦科学家用全国 600 万人的公开数据训练了一个基于 Transformer 的模型,成功预测了意外死亡和性格特点。丹麦技术大学 (DTU) 的研究人员声称他们已经设计出一种人工智能模型,据说可以预测人们的生活中的重大事件和结果,包括每个人死亡的大致时间。文章在前