抓取结果
ModelScope魔搭社区 ModelScope魔搭社区 ModelScope魔搭社区 模型库数据集创空间MCP研习社AIGC竞赛论文 去全站搜索看看? 登录 登录社区云 登录社区云,与社区用户共同成长 CSDN账号登录 ModelScope魔搭社区 邀请您加入社区 立即加入 欢迎加入社区 取消 确定 欢迎加入社区 取消 确定 Gemma 4 12B 开源:无编码器统一多模态架构,16GB 笔记本本地运行,性能逼近 26B 魔搭ModelScope社区 2026-06-05 不用地图也能规划公交路线?| TransitLM:首个大规模端到端公交路线生成数据集与基准 魔搭ModelScope社区 2026-06-04 96.33% 新SOTA!PaddleOCR-VL-1.6 发布,大模型时代的数据基座再升级 魔搭ModelScope社区 2026-06-04 自变量开源Wall-OSS-0.5:预训练即可部署的具身智能大模型,17个零样本任务验证泛化能力 魔搭ModelScope社区 2026-06-01 快手Keye2.0开源:将DSA注意力引入多模态,开启强化推理新范式 魔搭ModelScope社区 2026-06-01 提问题 加入社区 ModelScope魔搭社区 https://modelscope.csdn.net 成员 ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单。 欢迎加入社区 取消 确定 发布内容 类型 问答 讨论 标题 标签 无匹配数据 加载中 附件 添加附件 可以上传10M以内的文件,支持格式:zip,rar,7z,jpg,png,jpeg 温馨提示:您尚未绑定手机号 为遵守国家网络实名制规定,未绑定将限制内容发布与互动 立即绑定 注意:为提高问题回答效率,我们可能会把您的问题同步到CSDN等合作平台 取消 发布 Gemma 4 12B 开源:无编码器统一多模态架构,16GB 笔记本本地运行,性能逼近 26B Google DeepMind 开源了 Gemma 4 12B,一款约 11.95B 参数的统一多模态模型。它最特别的地方,是去掉了传统多模态模型里的视觉和音频编码器,让图像、音频信号直接进入 LLM 主干处理,也是 Gemma 4 家族里第一个原生支持音频输入的中尺寸模型。性能上,它逼近体积大一倍的 26B MoE,显存却只要不到一半:GPQA Diamond 78.8%、AIME 2026(无 魔搭ModelScope社区 1天前 80 不用地图也能规划公交路线?| TransitLM:首个大规模端到端公交路线生成数据集与基准 问题背景 公交路线规划是城市出行的基础能力。但你可能没想过,每天你用的「公交导航」背后,是一套极其复杂的工程体系。 图1: 传统方案(上)流程冗长;通用LLM(左下)产出断裂路线与幻觉站点;TransitLM(右下)通过隐式空间定位,端到端生成结构完整的连通路线。 传统方案:重依赖、长链路 传统公交规划依赖完整的地图基础设施——站点拓扑图、实 魔搭ModelScope社区 2026-06-04 14:39:12 33 96.33% 新SOTA!PaddleOCR-VL-1.6 发布,大模型时代的数据基座再升级 过去几个月,PaddleOCR相继发布了PaddleOCR-VL和PaddleOCR-VL-1.5,凭借强大而稳定的文档解析能力,已经被业界广泛用于大模型训练数据和应用数据构建。PaddleOCR-VL-1.5更是创新性地支持了异形框定位,在真实文档场景中表现优异。 最近,PaddleOCR正式推出PaddleOCR-VL-1.6,PaddleOCR-VL-1.6是在PaddleOCR-VL-1. 魔搭ModelScope社区 2026-06-04 09:21:07 47 自变量开源Wall-OSS-0.5:预训练即可部署的具身智能大模型,17个零样本任务验证泛化能力 自变量机器人(X Square Robot)开源了Wall-OSS-0.5,一个视觉-语言-动作(VLA)模型。在超过20种机器人形态、每轮超过100万条轨迹上完成预训练后,未经任何任务微调的预训练checkpoint直接在真实机器人上完成了17个任务的零样本测试,其中4个任务得分超过80分(满分100)。微调后在15项真实机器人任务上平均进度达60.5,领先π0.5达17.5分。模型权重、训练代 魔搭ModelScope社区 2026-06-01 17:17:15 84 快手Keye2.0开源:将DSA注意力引入多模态,开启强化推理新范式 引言 快手正式发布并开源新版多模态大模型Keye-VL-2.0-30B-A3B。当你把一段9分钟、在"晴空万里"与"冰天雪地"间剧烈切换的冰岛旅行Vlog输入给大模型要求做旅行攻略时,常规视觉大模型通常只能给出基于字幕和画面标签拼凑的流水账。Keye-VL-2.0-30B-A3B则能在连贯的时序流动中梳理因果并进行深度规划。这背后是率先将DSA(DeepSe 魔搭ModelScope社区 2026-06-01 11:00:19 88 1 阶跃开源 Step 3.7 Flash:面向生产级 Agent 的高效率 Flash 模型 阶跃星辰发布并开源Step 3.7 Flash,一款面向Agent生产化阶段的多模态Flash模型。采用稀疏MoE架构,总参数196B+1.8B(ViT),激活参数仅11B,最高生成速度400 Tokens/s。围绕Agent、Coding、Search与多模态工作流进行系统优化,支持云端和本地部署,已适配Claude Code、OpenClaw、Hermes Agent等主流Agent框架,现已 魔搭ModelScope社区 2026-06-01 10:47:08 93 别再让 AI 自动总结 Skill 了! 作者 姜饼 个人主页:https://modelscope.cn/profile/vcbbrdd 很多人第一次做 Skill,会把成功对话丢给 AI: “请把对话总结成一个可复用的 Skill。” AI 自动总结出来的 Skill,很多时候只是一个很长的 Prompt。 它看起来完整,有背景、有步骤、有格式。可下次复用时,很容易漏步骤、混规则、乱输出。 原因不是 AI 不会写文档,而是它不会自动完 魔搭ModelScope社区 2026-06-01 10:26:47 115 1 SCOPE 开源:首个跨游戏 FPS 世界模型,逐像素动作控制零样本泛化未见场景 中国科学院大学联合腾讯、新加坡国立大学等机构开源了 SCOPE,一个面向第一人称射击(FPS)游戏的交互式世界模型。该模型首次提出逐像素空间选择性动作调节机制,将离散事件(开火、换弹)的视觉效果精确约束在武器区域(scope 内),同时保持环境区域的稳定生成。基于 5B 参数视频扩散 Transformer 端到端训练,SCOPE 在 CrossFPS 测试集上 8 项指标中取得 7 项最优(JE 魔搭ModelScope社区 2026-05-29 10:24:34 87 CHI-Bench 开源:75 个美国医疗长程工作流压测 30 个前沿 Agent,最强 Claude Code 仅过 28%,端到端医院–保险工司协作直接归零 actAVA.ai 联合 Johns Hopkins、Wellstar、Yale、斯坦福、CMU、牛津、USC、UCSD 等 20 余家医疗机构与高校(Eric Xing、Sanmi Koyejo、Caiming Xiong、Philip S. Yu等)发布 CHI(χ)-Bench(Clinical Healthcare In-SituBenchmark),全球首个面向医疗长程工作流的 Agen 魔搭ModelScope社区 2026-05-28 10:40:22 67 AgentScope 2.0 发布:从"跑通 Demo"到"稳定落地",构建可靠智能体的工程底座 开发一个能“跑通 Demo 演示”的智能体并不难。 难的是,让它在真实场景里稳定地完成任务。 长链路任务中途断裂、工具调用缺乏安全边界、上下文越跑越臃肿、本地脚本难以接入生产环境……这些才是智能体走向落地时,开发者每天面对的硬骨头。 过去,AgentScope 1.0 以“透明开发”为核心,让开发者能清晰可见智能体的消息流转、工具调用和协作过程,从而降低理解与调试门槛。如今,面对更复杂的真实场景, 魔搭ModelScope社区 2026-05-28 10:10:34 176 加载更多 欢迎加入社区 取消 确定 ModelScope魔搭社区 加入社区 欢迎加入社区 取消 确定 提供社区服务与技术支持 提供社区服务与技术支持 ©1999-2023北京创新乐知网络技术有限公司 京ICP备19004658号
网站标题
ModelScope魔搭社区
关键词
ModelScope魔搭社区
站点描述
ModelScope魔搭社区 -ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单。