苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
IT之家 4 月 24 日消息,在 WWDC24 之前,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果Github库中获取。IT之家将官方简介翻译如下:大型语言模
IT之家 4 月 24 日消息,在 WWDC24 之前,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果Github库中获取。IT之家将官方简介翻译如下:大型语言模
针对大模型偶发脑回路故障难题,最新研究 GlitchHunter 收集了大量故障词元,并针对不同情况进行分类,极大改善了大模型的输出质量。如今,大型语言模型(LLM)已经成为了我们生活中的好帮手。当用户使用大模型时,模型首先会将输入的内容拆分成一个个的词元(token),通过分析这些词元来生成答案,
IT之家 4 月 23 日消息,据《日本经济新闻》报道,软银计划到 2025 年投资 1500 亿日元(IT之家备注:当前约 70.2 亿元人民币),加速 AI 大模型的开发工作。软银 2023 年就在生成式 AI 算力基础设施上进行了 200 亿日元(当前约 9.36 亿元人民币)的投资,此次追加
IT之家 4 月 21 日消息,微软本周公布并开源了最新一代大语言模型WizardLM-2,该模型的性能号称超越了GPT-4和Mistral,不过在相关模型上架后,微软突然无预警地在未说明情况下又删除了所有项目文件和代码文件,截至IT之家发稿相关模型还未上架。目前微软相关工程师在X平台发文解释了原因
近日,LLM 竞技场更新了战报,Command R + 推出不到一周,就成了历史上第一个击败了 GPT-4 的开源模型!目前,Command R + 已经上线 HuggingChat,可以免费试玩。排行榜地址:https://huggingface.co/ spaces / lmsys / chat
IT之家 4 月 20 日消息,Meta 公司昨日宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。与此同时,高通宣布支持 Meta Llama 3 在骁龙终端上运行。据介绍,双方将优化 Meta Llama 3 大语言模型(LLM)直
IT之家 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事
IT之家 4 月 17 日消息,国内 AI 初创企业MiniMax 稀宇科技今日正式推出MoE 混合专家模型架构的 abab 6.5 系列模型,核心能力开始接近GPT-4、 Claude-3、 Gemini-1.5。abab 6.5 系列包含两个模型:abab 6.5:包含万亿参数,支持 200k
IT之家 4 月 14 日消息,4 月 11 日,国家互联网信息办公室发布第五批深度合成服务算法备案信息的公告,由国投智能研发的“天擎公共安全大模型算法”通过深度合成服务算法备案,成为国内首个通过备案的公共安全领域大模型算法。IT之家了解到,国投智能为国投集团参与国家数字经济安全稳定发展平台,研发发
IT之家 4 月 14 日消息,据工信部官网,人工智能赋能新型工业化企业座谈会暨第八次制造业企业座谈会于前日召开。工业和信息化部党组书记、部长金壮龙在会上表示,要大力发展基于AI大模型的智能装备、软件等智能产品。会中,来自人工智能技术供给侧、智能化转型需求侧的 11 家企业负责人互相交流发言,介绍了
近日,Picsart AI Resarch 等团队联合发布了 StreamingT2V,可以生成长达 1200 帧、时长为 2 分钟的视频,一举超越 Sora。同时,作为开源世界的强大组件,StreamingT2V 可以无缝兼容 SVD 和 animatediff 等模型。120 秒超长 AI 视频
IT之家 4 月 13 日消息,马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不
谷歌大改 Transformer,“无限”长度上下文来了。现在,1B 大模型上下文长度可扩展到 1M(100 万 token,大约相当于 10 部小说),并能完成 Passkey 检索任务。8B 大模型在 500K 上下文长度的书籍摘要任务中,拿下最新 SOTA。这就是谷歌最新提出的 Infini-
在内部讲话中,李彦宏对大模型开源与闭源的路线选择以及 AI 创业者应该专注模型还是应用等业界焦点话题,发表了自己的看法。李彦宏认为,闭源模型在能力上会持续地领先,而不是一时地领先。模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源一比如 Linux、安卓等等很不一样。“闭源,是有真正的商业模
IT之家 4 月 11 日消息,Mistral AI 公司近日推出了 Mixtral 8x22B 开源模型,共有 1760 亿个参数,Context 长度(上下文文本)为 6.5 万个 token,可以通过 Torrent 下载。Mistral AI 公司自成立以来一直备受外界关注,“6 人团队,7
IT之家 4 月 9 日消息,据联发科官方消息,在今日举行的生成式 AI 论坛期间,联发科生成式 AI 服务平台 MediaTek DaVinci 正式推出,亦称“联发科技达哥”,目前已有超过 40 家厂商加入其生态系统。据悉,该工具最初为集团内部生成式 AI 工具,被广泛应用于软件开发的需求分析
IT之家 4 月 9 日消息,苹果健康研究团队 3 月底发布博文,利用机器学习和 AI 技术,为用户探索更适合的健身计划。苹果健康研究团队表示当前模型是在高度受控的实验室环境下,观测某个变量对用户健身效果的影响,这样得出的数据可能与 Apple Watch 在真实世界中产生的心率信息完全不同。因此该
【新智元导读】Anthropic 发现了大模型的惊人漏洞。经过 256 轮对话后,Claude 2 逐渐被「灌醉」,开始疯狂越狱,帮人类造出炸弹!谁能想到,它的超长上下文,反而成了软肋。大模型又被曝出安全问题?这次是长上下文窗口的锅!今天,Anthropic 发表了自己的最新研究:如何绕过 LLM
IT之家 4 月 2 日消息,昆仑万维集团今日宣布,其音乐生成大模型“天工 SkyMusic”即日起开启免费邀测。本轮邀测将开放 1000 个免费名额,面向行业媒体、专家、以及感兴趣的音乐从业者开放,正式版将在 4 月 17 日随「天工 3.0」面向全社会免费开放。“天工 SkyMusic”号称目前
IT之家 4 月 2 日消息,虽然目前 Siri 可以尝试描述信息中的图像,但效果并不稳定。不过,苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中,苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型,而且他们认为这个名为 ReALM 的模型在测试中优于 OpenAI 的知名语
让大模型直接操纵格斗游戏《街霸》里的角色,捉对 PK,谁更能打?GitHub 上一种你没有见过的船新 Benchmark 火了。与 llmsys 大模型竞技场中,两个大模型分别输出答案,再由人类评分不同 —— 街霸 Bench 引入了两个 AI 之间的交互,且由游戏引擎中确定的规则评判胜负。这种新玩
IT之家 3 月 31 日消息,谷歌在 3 月初发布了一个奇怪的声明,称旗下两款新手机 Pixel 8 和 Pixel 8 Pro 中,只有 Pixel 8 Pro 能够运行其最新的人工智能模型“Google Gemini”。尽管两款手机的配置非常相似,但谷歌却以神秘的“硬件限制”为由拒绝在 Pix
IT之家 3 月 31 日消息,Databricks 近日在推出了一款通用大语言模型 DBRX,号称是“目前最强开源AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。IT之家从官方新闻稿中得知,DBRX 是一个基于 Transformer 的大语言模型,采用 MoE(Mixture of
IT之家 3 月 30 日消息,OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将
IT之家 3 月 27 日消息,市场调查机构 Factorial Funds 近日发布报告,认为 OpenAI部署文本转视频模型 Sora,在峰值期需要 72 万片英伟达 H100 AI 加速卡。如果按照每片英伟达 H100 AI 加速卡 3 万美元成本计算,72 万片需要 216 亿美元(IT之家
IT之家 3 月 25 日消息,据 Meta 公司官方新闻稿,该公司开发了一款名为“SceneScript”的视觉模型,该模型号称能够使用可编程语言来快速“建立”场景,实时推断房间几何形状,并将相关数据转换为建筑学层面的近似值。▲ 图源Meta 公司官方新闻稿(下同)Meta 声称,相关方法能够高效
IT之家 3 月 21 日消息,小米 Civi 4 Pro 手机将于今日 14 点发布。正式亮相前,官方继续对这款新机进行预热。据介绍,小米 Civi 4 Pro 前置 3200 万像素仿生双主摄,包含一颗 78° 美人镜,一颗 100° 超广镜。该机还继承了小米 14 Ultra “大师人像”,通
IT之家 3 月 20 日消息,彭博社上周末爆料称,苹果公司正在和谷歌磋商,计划在 iOS / iPadOS 系统中引入 Gemini 模型,为 iPhone / iPad 提供某些 AI 功能。纽约时报近日再次从内部渠道确认了这条消息,并披露了更多的细节,IT之家翻译相关内容如下:苹果公司确实已经
IT之家 3 月 19 日消息,谷歌今日官宣了一系列在医疗保健行业部署 AI 模型的计划。根据计划,谷歌研究团队和其拥有的 Fitbit 公司正在开发一系列新的人工智能功能:从腕带中提取数据并指导用户的个人健康,该工具由谷歌人工智能模型 Gemini 提供支持。此外,谷歌还宣布与印度医疗中心 Apo
IT之家 3 月 19 日消息,今日阿里大模型产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟接入通义千问大模型,融合了十多项 AI 功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等,并支持标重点、记笔记。通义
IT之家 3 月 19 日消息,英伟达正在举办的 GTC 开发者大会上,推出了一项全新的服务,帮助企业将 3D 应用中交互式通用场景描述(OpenUSD)串流到 Apple Vision Pro 混合现实头显中。该技术利用英伟达最新的 Omniverse Clouds API,使用英伟达 Graph
全球首个开源的类 Sora 架构视频生成模型,来了!整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。这就是刚刚发布的 Open-Sora 1.0。它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。还能用航拍视角,展现悬崖海岸边,海水拍打着岩石的画面。亦或是延时摄影下的浩瀚星空。自
IT之家 3 月 18 日消息,据新浪科技报道,今日举行的 2024 澜舟科技大模型技术和产品发布会期间,澜舟科技宣布与创新工场董事长李开复创立的零一万物达成战略合作。创新工场董事长、零一万物 CEO 李开复在今天的活动中表示,大模型的智力水平在两年前就已经比普通人水平“好一点”,而在目前,世界上最
IT之家 3 月 17 日消息,据谷歌官方新闻稿,谷歌近日推出了一项名为 Cappy 的模型打分框架,该框架以 RoBERTa 语言模型为基础,主要用于检测模型输出的内容,并为相关内容打分,之后相关分数将会作为参考基准让模型学习,从而让模型更聪明。▲ 图源 谷歌官方新闻稿(下同)此外,Cappy 框
IT之家 3 月 11 日消息,据外媒 SiliconANGLE 报道,由 Tenstorrent 创始人 Ljubisa Bajic 领导的 AI 芯片创企 Taalas 已收获两轮共计 5000 万美元(IT之家备注:当前约 3.6 亿元人民币)的融资,该公司目标为特定 AI 模型打造专用芯片。
【新智元导读】Sanctuary AI 发布了世界第一个能够以人类的速率自主完成任务的机器人,他们通过在远程控制机器人操作获取数据,在虚拟空间训练,完成了这一壮举。这周,由 OpenAI,微软,贝索斯,英伟达投资的机器人公司 Figure AI 融资接近 7 亿美元,号称在 1 年之内要做出等独立行
IT之家 3 月 10 日消息,阿里巴巴集团 CEO、阿里云智能董事长吴泳铭近日在《中国网信杂志》撰文称,作为国内基础大模型的代表之一,通义千问正加快追赶 GPT-4,并把基础大模型能力释放出来。吴泳铭表示,AI 大模型将开启全新的智能时代,引发人机交互、计算范式和认知协作三场革命,通过开放 AP
IT之家 3 月 8 日消息,印度政府宣布已批准国家级“IndiaAI 使命”项目,旨在实现“让 AI 在印度扎根”和“让 AI 为印度服务”两大目标,预算达 1037.192 亿卢比(当前约 90.13 亿元人民币)。据介绍,该项目将由数字印度公司(DIC)旗下的“IndiaAI”独立业务部门(
IT之家 3 月 7 日消息,IT之家从阿里云官方公众号获悉,今日,物流行业内首个专注于大模型应用研究与实践的联盟“物流智能联盟”在杭州成立,旨在加速大模型在物流领域落地,用 AI 助力物流行业增效降本和业务创新。据悉,该联盟由中国物流与采购联合会、阿里云、菜鸟、高德地图、中远海运、东航物流、圆通
Mac 用户,终于不用羡慕 N 卡玩家有专属大模型 Chat with RTX 了!大神推出的新框架,让苹果电脑也跑起了本地大模型,而且只要两行代码就能完成部署。仿照 Chat with RTX,框架的名字就叫 Chat with MLX(MLX 是苹果机器学习框架),由一名 OpenAI 前员工打
IT之家 3 月 4 日消息,人工智能创业公司 Anthropic 今日宣布推出其突破性的 Claude 3 系列模型,该系列大型语言模型 (LLM) 在各种认知任务上树立了新的性能标杆。Claude 3 系列包含三个子模型,分别为 Claude 3 Haiku、Claude 3 Sonnet 和
IT之家 3 月 4 日消息,华为中国官微今日宣布,去年 12 月,在由中国信通院组织的可信 AI 大模型标准符合性验证中,华为云盘古大模型顺利完成金融大模型标准符合性验证,并获得“优秀级”(4 + 级)评分。官方表示,这也是本次金融大模型评测各厂商中的最高等级。据悉,华为云盘古大模型成为首批通过金
IT之家 3 月 3 日消息,汤姆猫今日在互动平台表示,公司正在推进申请接入 OpenAI 的 Sora 模型,并计划进行相关的素材制作的测试,目前暂未正式接入 Sora。在生成视频领域,公司已利用 Pika、Runway、Stable Diffusion 等工具制作了部分视频素材,探索该等素材在营
IT之家 3 月 1 日消息,2 月份,usmile 笑容加带来了数字牙刷新品 Y20,据介绍,usmile 笑容加数字牙刷 Y20 搭载了智能 AI 算法小模型,会主动记录每一次刷牙行为,并生成个人刷牙数据库;同时也是笑容加首款骨传导数字牙刷产品。接下来,IT之家为大家带来 usmile 笑容加数
【IT之家评测室】usmile 笑容加数字牙刷 Y20 体验:AI 算法小模型 + 骨传导,会说话的数字牙刷 尽管电动牙刷已经成为现代生活中的必备品,但仅仅拥有一台电动牙刷并不意味着就能拥有科学、合理的刷牙习惯。为了更好地满足用户的健康需求,usmile 笑容加于去年 9 月份推出了双面屏数字牙刷
IT之家 2 月 28 日消息,据IT之家小伙伴投稿,魅族20 / Pro手机目前获推Flyme 10.5.0.0A稳定版更新,体积为162.08MB。▲ 图源 IT之家图赏:魅族 20 Pro据介绍,该更新主要为系统内置的Aicy 语音助手接入AI大模型,正在使用系列手机的小伙伴可以升级体验。I
IT之家2 月 28 日消息,魅族 21 系列推出了 Flyme 10.5.0.1A 稳定版系统,语音助手接入 AI 大模型,正在使用魅族 21 系列的小伙伴可以前去升级体验。本次系统更新主要内容整理如下:Aicy 语音语音助手小溪接入 AI 大模型,支持自然语言对话、文档总结、知识问答、出行规划
IT之家 2 月 28 日消息,蚂蚁集团宣布推出 20 亿参数多模态遥感基础模型 SkySense,支持文本、红外光、可见光、SAR 雷达等多种模态,支持多分辨率的时序遥感影像建模,可用于地貌、农作物观测和解译等,有效辅助农业生产和经营。据介绍,研发人员蚂蚁百灵大模型多模态能力,使用内部构建的 19
IT之家 2 月 27 日消息,近日,微软推出了升级版的 AI 伴侣 Copilot,其中新增了一项定制的 GPT 功能 ——“健身教练(Fitness trainer)”,可以帮助用户解答健身方面的问题。这一消息由 Copilot 负责人 Jordi Ribas 通过社交媒体平台 X 发布。Jor
扩散模型,迎来了一项重大新应用 —— 像 Sora 生成视频一样,给神经网络生成参数,直接打入了 AI 的底层!这就是新加坡国立大学尤洋教授团队联合 UCB、Meta AI 实验室等机构最新开源的研究成果。具体来说,研究团队提出了一种用于生成神经网络参数的扩散模型 p (arameter)-diff
IT之家 2 月 25 日消息,中兴手机今日宣布,今年中兴终端也将发布自研 AI 大模型,以及中兴首款 AI 旗舰终端。在中兴星云 OS 及 AI 大模型技术的加持下,中兴终端全场景智慧生态 3.0 亮相 MWC2024。从官方公布的预热图来看,中兴终端 AI 大模型应用架构包括智能场景、交互技术、
IT之家 2 月 23 日消息,据界面新闻报道,从知情人士处获悉,字节跳动发布了文生图开放模型 SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。文生图是一种利用人工智能技术,根据文本描述生成图像的技术。目前,文生图领域的主流模型都采