写点什么

微软将深度整合 Azure AI 与 GitHub;Stability AI 0.5 秒生成三维建模丨 RTE 开发者日报

作者:声网
  • 2024-08-05
    四川
  • 本文字数:2338 字

    阅读完需:约 8 分钟


开发者朋友们大家好:


这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、一张图即可 0.5 秒生成三维建模,Stability AI 推出「Stable Fast 3D」模型


Stability AI 近天推出了一款名为 Stable Fast 3D 的 AI 模型,该模型主打「图生 3D 模型」,号称只需 0.5 秒就能快速生成完整且自然的 3D 模型,目前该模型已在 Hugging Face 平台上架。


Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型,相关模型自带材质及对应的参数,同时提供了精确的 UV 展开(UV Unwrapping)便于用户进行后期修改,如果用户需要,还可以选择四边形或三角形网格重建功能,相关工作只需多耗费 100 至 200 毫秒时间即可完成,能够允许用户更细致地控制模型网格拓扑结构。


官方同时提到,Stable Fast 3D 能够在利用图片生成模型时尽可能减少原图中主体受光照影响的痕迹,以便于生成的模型在不同的环境光照下都可以呈现出正确的颜色。(@IT 之家)


2、微软宣布将 Azure AI 与 GitHub 进行深度整合,大幅简化 AI 应用开发流程



微软宣布与 GitHub 合作,旨在通过 GitHub.com 无缝集成 Codespaces 和 Visual Studio Code,使超过 1 亿开发者能够直接从 GitHub 构建 AI 应用。这一合作使 AI 开发更加便捷和可扩展,为开发者提供通过 GitHub Models 和简单 API 访问 Azure AI 领先模型的机会。


新功能允许开发者直接在 GitHub 中访问和使用 Azure AI 服务。


集成包括代码生成、AI 辅助编程和自动化测试等功能。


开发者可以在 GitHub Models 中直接使用 Azure AI 最新的 AI 模型库


开发者可以使用 Azure AI 推理 API 轻松实验和比较不同的 AI 模型,无需更改底层代码。


(@小互 AI)


3、斯坦福 AI 实验室推出 AlphaXiv 论文讨论平台,可进行实时讨论


AlphaXiv 由斯坦福 AI 实验室的学生 Rehaan Ahmad 和 Raj Palleti 打造,他们都曾在吴恩达实验室工作。该平台允许用户注册账号后对 arXiv 上的论文进行评论和讨论,支持不同类型的评论,如一般性问题、研究性见解、资源分享和私人笔记。用户可以申请成为 reviewer,参与论文评审和讨论主持。


AlphaXiv 最初是作为 web 开发课的期末作业启动,后来在斯坦福内部得到了实验室的使用和优化。该平台支持与 ORCID 系统的集成,实现了身份识别和学术成果链接。目前,AlphaXiv 已经吸引了多个实验室的合作,并且获得了业内专家的关注和支持。(@AI 科技评论)


4、为推进人工智能语音项目,Meta 向好莱坞明星提供百万美元报酬


据彭博社报道,Meta 准备向好莱坞明星们提供数百万美元,以换取他们的录音和在人工智能项目中使用他们的声音的权利。知情人士表示,Meta 正在与公司正在与朱迪·丹奇,奥卡菲娜和基根·迈克尔·基就此事进行交谈。


报道指出,Meta 公司正在加紧达成交易,以便有时间开发一套人工智能工具,并在 9 月份的 Connect 2024 活动上亮相。


知情人士表示,虽然目前还不完全清楚 Meta 将如何使用这些声音,但已经讨论了一款可以充当数字助理或朋友的聊天机器人。例如,用户可以与拥有奥卡菲娜声音的聊天机器人交谈。(@爱范儿)


5、MindSearch:匹敌 Perplexity.ai 模仿人类在网络上寻找和整合信息的 AI 搜索


上海 AI Lab 开源了名为 MindSearch 的 AI 搜索工具,能力与 Perplexity Pro 相当,提供了在线演示和代码,支持深入理解问题并构建动态搜索思维图谱,基于 MultiAgent 架构提升可信度和可用性。


MindSearch 能够浏览数百个网页来深入理解和回答问题,动态构建搜索思维图谱。该工具基于 MultiAgent 架构,旨在提高可信度和可用性。MindSearch 的核心功能包括动态构建思考图谱,通过 MultiAgent 反思机制来提高可信度,以及支持解决生活中的任何问题,进行深入问题解决,并优化用户界面。在超过 100 个人工设计的现实问题上,MindSearch 在深度、广度和真实性上均超越了 ChatGPT-Web 和 Perplexity Pro。(@AI 科技评论)

02 有态度的观点

1、吴声:人是 AI 终端的终极形态


据新浪科技报道,在新物种爆炸·吴声商业方法发布 2024 活动上,场景实验室创始人吴声表示,2024 年,联想 AI PC 正在开启个人的 Agent 时代。


他现场喊话联想,表示「不要辜负我们的期待」。他认为,端智能正在迎来了一个全新的好时代,端正在成为具体场景的最大公约数。


在吴声看来,在这样的背景下,「人才是 AI 终端的终极形态,这个人不是人形机器人,而是我们在座的每一个人,我们都是 AI 终端的终极形态」。(@爱范儿)


2、京东云总裁:大模型要用起来才能活起来


京东集团技术委员会主席、京东云事业部总裁曹鹏接受澎湃新闻记者采访时谈到了 AI 大模型应用的一些观点。


曹鹏认为,大模型要用起来,才能「活起来」。「当下没有一个模型可以解决企业所有场景的应用,通用大模型可以靠卡堆出来,但好的企业大模型,必须要靠业务用出来。」,曹鹏说。


谈及 AI 的前景,曹鹏认为,在模型训练和整体算力上确实存在泡沫,从商业应用角度,他更看好 B 端(企业端)场景的最后打通,认为现在的模型还不足以支撑其在 C 端(消费者端)出现智能化。(@爱范儿)


写在最后:


我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



素材来源官方媒体/网络新闻

用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
微软将深度整合 Azure AI 与 GitHub;Stability AI 0.5 秒生成三维建模丨 RTE 开发者日报_声网_InfoQ写作社区