代码数据两不误,小浣熊请求出战
2024 年,科技领域内最引人注目的当属 AI 赛道,上半年以来,各类 AI 产品如雨后春笋般涌现,涵盖了智能助手、自动化工具、AI 生成内容等多个领域。这些产品纷纷标榜着能够显著提升生产力和效率,通过各种渠道进行大肆宣传,吸引了众多用户和业界的关注。
在此之前,我也体验过不少 AI 相关的产品,其中大部分都是文生图、文生文、文生视频等等,对于生成数据化这块几乎没有涉及,要不是这次征文活动,我还不知道商汤科技的小浣熊对于数据化分析这块这么强大。体验了几天,在工作中确实给了我很大的帮助,接下来,通过文字的形式把这款神器分享给大家。
商汤科技
我一般遇到好产品的时候都会先去了解一下这家公司,我会在想到底是怎样的公司才能开发出这么棒的产品。在我查阅资料的时候,没想到商汤科技创始人汤晓鸥老师于 2023 年 12 月 15 日已经辞世。汤晓鸥老师是一位杰出科学家、行业领军人物和可敬可爱的良师。让我们一起向汤晓鸥老师致敬。👬
商汤科技是一家人工智能软件公司,它的使命是“坚持原创,让 AI 引领人类进步”。公司努力做人工智能的前沿研究,想打造一个能让更多人用上的、功能也更强大的 AI 软件平台,帮助经济、社会和人类发展,并且吸引和培养厉害的人才,一起创造未来。
商汤科技在学术上很有积累,一直专注做原创技术研究,让它在很多 AI 的关键技术领域,比如感知、理解语言、做决策、生成内容等方面都很厉害。它还研发了 AI 芯片、传感器和算力基础设施等关键技术。商汤还做了个特别厉害的新型人工智能基础设施,叫 SenseCore,它把算力、算法和平台都连起来了。
在这个基础上,商汤又建立了“商汤日日新 SenseNova”大模型和研发体系,这样用比较低的成本就能做很多 AI 任务,让 AI 的创新和实际应用变得更高效、更便宜、规模更大。这样一来,商汤就能更好地帮客户赚钱,解决很多以前解决不了的问题,让 AI 进入工业化发展阶段。商汤的业务包括生成式 AI、传统 AI 和智能汽车,它的产品和解决方案都受到了客户和合作伙伴的好评。
商汤还很注重 AI 的伦理问题,积极参与制定关于数据安全、隐私保护、AI 伦理和可持续 AI 的行业、国家和国际标准,还和很多国内外的机构合作,一起推动 AI 的可持续和伦理发展。商汤的《AI 可持续发展道德准则》还被联合国的人工智能战略资源指南收录了,这是亚洲唯一获得这个荣誉的 AI 公司。
代码小浣熊
小浣熊家族根据使用场景的不同,分为代码小浣熊
和办公小浣熊
多种编程语言支持
代码小浣熊亮点之一就是支持多种编程语言,比如:Python、C#、JavaScript、GO 等等
不仅如此,它还支持多种 IDE,也就是常说的开发工具,比如:支持 VS Code、Android Studio、JetBrains 全系列 IDE。
我们可以在 VSCode 的插件市场中直接搜索“Raccoon”即可,目前在 VSCode 上的下载量已经超过 20000 次,还是有不少小伙伴在使用的。
接下来,就分享一些我在使用代码小浣熊助手中的一些心得和体会
代码补全
🌰:我们先来一个简单的,用 H1 标签生成 helloworld 标题
代码小浣熊可以很好的感受到我的需求,并输出代码结果。接下来我们加大难度,看看小浣熊有什么表现
哇哦,你别说,这个小浣熊还真不错,不仅可以补全代码,连注释都可以补全。
代码问答
🌰:我们让小浣熊用 js 写一段经典的深度克隆代码,要求里面要包含错误🤪
接着我们继续用这段错误代码询问小浣熊,看看有什么错误?如何完善这段代码让其性能更好?
小浣熊说这段代码是一个 JavaScript 函数,名为 deepClone
。它的目的是创建一个对象的深度克隆,即复制一个对象及其所有嵌套对象,而不仅仅是引用。这个函数可以处理普通对象和数组,但不适用于特殊类型(如函数、日期等)。
小浣熊的回答让我出乎意料,代码的分析是逐行进行的,一目了然,对于正在学习编程的小伙伴来说非常友好。
最后,小浣熊帮我完善了一下代码:
要改进这个 deepClone
函数以提高性能并使其能够处理更复杂的对象,我们可以考虑以下几点:
处理特殊类型的属性:原始代码不处理函数、日期等特殊类型的属性。我们可以添加逻辑来处理这些类型。
优化循环:使用
Object.keys()
或Object.entries()
替代for...in
循环,以避免遍历原型链上的属性。处理循环引用:原始代码不处理对象中的循环引用。我们可以添加一个映射来跟踪已经克隆的对象,以防止无限递归。
优化递归调用:在递归调用
deepClone
时,可以检查是否需要递归,以减少不必要的调用。
下面是改进后的 deepClone
函数:
从以上小试中代码小浣熊
在协助我们进行问答和代码翻译方面表现得非常出色👍🏻,有了它的帮助,我们在写代码以及阅读源码过程中会变得非常轻松。😎
办公小浣熊
除了代码小浣熊,商汤科技还给职场人提供了办公小浣熊,它是基于商汤大语言模型的大模型原生数据分析产品。通过用户的自然语言输入,结合商汤大模型的能力,自动把这些数据变成容易懂的分析和图表。这个小浣熊特别聪明,能看懂很复杂的表格,哪怕是很多表格或者文件堆在一起,它也能一一搞定。它能帮你干很多数据分析的活儿,比如整理数据、算数据、比较不同的数据、看数据的变化趋势,还能预测未来可能会怎么样,并且把结果做成图表给你看。
文字生成表格
在日常办公中,文字生成表格的需求还是蛮多的,我们经常会把整理好的文本弄成表格,我根据季节的不同,列出了几个热门旅游城市。文本内容如下:
然后把数据喂给小浣熊,看看结果
从结果来看,这就是我想要的结果,小浣熊还是不错的,但是在生成的过程中遇到一个小问题:
📢 在尝试导出为 .xls
格式时遇到了问题。不过小浣熊尝试导出为 .xlsx
格式,这一点我觉得特别友好👍
图标生成
考勤表是公司常用表格之一,这里我用一张考勤表来测试一下小浣熊
测试结果:
小浣熊精准的识别出这是一张考勤表,分析每一列和每一行的内容,令我没想到的是小浣熊会将表 1、表 2、节假日以及使用说明都分析出来了,非常 nice👍
👉 我们根据姓名和出勤总天数,借助办公小浣熊,可以生成美观的条形图、饼状图和折线图
数据处理
数据缺失如何处理
这里我上传了一张数据缺失的表格,看看小浣熊怎么处理这个问题
首先,我让小浣熊分析了一下缺失值的表格
小浣熊也不负众望,识别出缺失的值,并且提出几种解决方案,这里我选择插值方案
小浣熊完美地帮我填充了空缺的数据。
无效样本处理
这里我上传了一张无效样本的表格,看看小浣熊怎么处理这个问题
一般对于无效样本处理不是填充数据,就是直接删除,小浣熊这里提示进行数据清洗或者数据插值,这两者有什么区别呢?数据清洗和插值是两种不同的数据处理技术,它们在处理缺失或不完整数据时具有不同的应用和目的。
👉 数据清洗:
数据清理说白了就是删除不需要的数据(比如错误的数据或者重复的数据),又或者修补数据(比如填补空缺的数据),一般来说当数据中的缺失值是随机的、不成系统,或者缺失值的数量相对于整个数据集来说不是很大时,数据清洗是一种有效的处理方法。
👉 插值:
插值是用于处理数值型数据的缺失问题,就是用已知的数据值来估计未知的数据值,一般当数据值之间的关系可以通过数学函数描述时,特别是在时间序列数据中,插值是一种有效的处理方法。
数据清洗是一种更广泛的概念,包括了多种处理数据的方法,而插值则是一种特定的数学方法,主要用于处理数值型数据的缺失问题。
最后的话
AI 的重要性已不言而喻,在长期的使用过程中,我深感它们带来的便利与高效,而商汤科技的小浣熊助手,正是我对国产 AI 未来充满期待的缩影。我真诚地希望,小浣熊助手不仅仅是一款工具,更能成为我们工作和生活中的得力伙伴。也希望小浣熊助手能够在保障用户隐私和数据安全的前提下,不断创新,拓展更多的应用场景,让 AI 技术真正惠及每一个人。✌
版权声明: 本文为 InfoQ 作者【法医】的原创文章。
原文链接:【http://xie.infoq.cn/article/621e01f9594f8f304ac582eef】。文章转载请联系作者。
评论