写点什么

日常办公就选小浣熊,YYDS

作者:多啦A梦
  • 2024-07-14
    陕西
  • 本文字数:3117 字

    阅读完需:约 10 分钟

小浣熊是何许熊也?


说起来真挺有意思的,前段时间我还买了几包小浣熊方便面,今天要说的小浣熊并不是吃的,有个叫做“小浣熊家族”的 AI 智能助手,它是基于一个叫做商汤的大语言模型做出来的 AI 工具系列,就像是给工作和学习装上了智能小帮手一样。这个家族可厉害了,它能在软件开发、数据分析,还有编程教育等等好多地方帮忙,就是用那些很先进的人工智能技术,让我们的工作和学习变得更有效率,更轻松。


目前为止这个家族已经有了两位超给力的成员,一个叫“代码小浣熊”,另一个叫“办公小浣熊”,最后一个叫 X-小浣熊,目前还在开发中,不知道有什么超能力。它们俩可勤快了,已经给超过十万的用户提供了好几亿次的智能辅助服务,就像是身边随时待命的小助手,是不是听起来就很酷呀!



办公小浣熊


办公小浣熊听起来就像是个特别厉害的办公小助手!它其实是基于商汤的那个大语言模型做出来的,专门帮我们做数据分析的神器。你知道吗,我们平时面对一大堆数据的时候,总是头疼得要命,不知道从哪里入手。但是有了这个办公小浣熊,一切就变得简单多了。


你只需要用平时说话的方式,告诉它你想分析什么,它就会自动把那些复杂的数据变成有意义的分析和漂亮的可视化图表。是不是很厉害?


而且啊,这个办公小浣熊还特别聪明,它能理解那些复杂的表格,就算是多个表格、多个文件放在一起,它也能搞得定。它能帮我们做数据清洗,就是把那些乱糟糟的数据整理得井井有条;还能做数据运算,比较分析,趋势分析,甚至是预测性分析呢!最后,它还会把分析结果变成图表,让我们一眼就能看出数据的奥秘。然后我们一起玩一玩这只小浣熊。

页面布局



办公小浣熊的页面布局设计得相当出色,让我这个新手也能轻松上手。首先,我们来看看页面的顶部,那里有一个导航栏,它就像是一个小地图,告诉我们页面上有哪些功能。导航栏上有“当前会话”、“历史回溯”、“数据管理”和“人设管理”,这样我就能快速地找到我需要的功能了。而且,导航栏一直固定在页面的顶部,无论我滚动到哪里,它都在那里,非常方便。


接下来,我们看看页面的主要内容部分。页面被分成了左右两个区域。左边是一个功能区,我可以选择上传本地的文件,或者导入数据库文件,还能管理那些还没处理完的文件。每个功能都有明确的标题和按钮,一看就懂,操作起来也很简单。


右边的区域则是信息展示区。这里展示了办公小浣熊的各种数据处理和分析能力,比如“数据处理”、“数据降维”、“线性回归”等等。这些高级功能对于我这个新手来说可能有点复杂,但没关系,我可以慢慢学习。而且,这里还有很多用户共建的样例,比如“花卉品种分析”、“身高体重关系表”等,我可以直接参考这些样例来操作。


在页面的底部,还有一个信息提示区域。如果我有任何疑问或者需要帮助,都可以在这里输入问题,办公小浣熊会尽力回答我。


办公小浣熊的页面设计得非常人性化,界面简洁明了,功能全面且易于操作。无论是新手还是老手,都能轻松上手。特别是那些图表展示,让数据变得更加直观易懂,真的非常实用。如果你也需要处理和分析数据,不妨试试办公小浣熊吧!


缺失值的处理


我们先来看看小浣熊对于缺失值是怎么处理的?这是官方提供的缺失值的表格,先试试水



表格中个别格子是空的,没有什么数据,我们将所有空的用 0 进行填充



然后当我想把表格中大于 60 的数字改成 x 时出现了问题,修改后的文件不存在,不知道这是不是一个 bug



数据降维


使用 pca 降维方法把该数据降为 5 列并导出,下面这是原始文件



看看小浣熊是怎么处理的



数据降维是一种减少数据集中变量数量的技术,同时尽量保留原始数据的重要信息。在这个过程中,小浣熊使用了主成分分析(PCA)方法。我们可以通过小浣熊的代码查看数据降维的详细步骤:


  1. 导入必要的库:首先,小浣熊导入了用于数据处理的pandas库和用于执行 PCA 的sklearn.decomposition库中的PCA类。

  2. 读取数据:读取了提供的 Excel 文件,并将其加载到一个 pandas DataFrame 中。这个 DataFrame 包含了原始的多维数据。

  3. 应用 PCA:创建了一个 PCA 对象,指定了需要的主成分数量为 5。然后使用fit_transform方法对原始数据进行了拟合和转换。这一步是 PCA 的核心,它将原始的高维数据转换为低维数据。

  4. 转换为 DataFrame:降维后的数据是一个 NumPy 数组,将它转换回 pandas DataFrame,以便于查看和后续处理。新的 DataFrame 有 5 列,分别代表 5 个主成分。

  5. 导出数据:最后将降维后的数据保存到一个新的 Excel 文件中,以便于下载和使用。


PCA 的工作原理是找到数据中的主要变化方向,并按照这些方向重新组织数据,从而减少数据的维度。这些主成分是原始数据中变化最大的方向,它们捕捉了数据中的大部分变异性。通过保留前几个主成分,我们可以在损失相对较少信息的情况下显著减少数据的维度。


线性回归

这是一张关于房子信息的一张表格,然后我们用它来操作



小浣熊帮我预测了五个房价



线性回归是一种用于预测连续型响应变量(目标变量)的统计方法,基于一个或多个预测变量(特征)。在这个案例中,小浣熊使用房龄、是否有电梯、楼层高度和房间平方作为预测变量来预测房价。


  1. 数据准备:首先从提供的数据集中提取了所需的特征(房龄、是否有电梯、楼层高度和房间平方)和目标变量(房价)。

  2. 数据分割:为了评估模型的性能,将数据集分为训练集和测试集。通常,数据被随机分为两部分:一部分用于训练模型,另一部分用于测试模型。

  3. 模型训练:使用训练集,它训练了一个线性回归模型。这一步是通过找到最适合数据的直线(或超平面,对于多个特征的情况)来完成的。

  4. 模型预测:模型训练完成后,它使用测试集中的数据进行预测,以评估模型的性能。

  5. 性能评估:计算了模型的均方误差(MSE)和决定系数(R²)。MSE 衡量预测值与实际值之间的平均平方差异,R²表示模型解释目标变量变化的百分比。

  6. 结果解释:根据模型的预测结果和性能指标可以评估模型的准确性和适用性。


在这个过程中,小浣熊使用了 Python 的 Scikit-learn 库,这是一个强大的机器学习库,提供了简单和高效的工具用于数据挖掘和数据分析。


图表生成


这是一张电商销售额的表格,我们用它来做图表



根据销售额数据做一张柱状图,包含销售额、目标销售额、完成销售额



根据访客人数做成折线图



小浣熊从表格数据到生成图表主要经历了以下步骤:


第一步,咱们得先把数据读进来,对吧?这时候就用到了 Python 里的一个特别厉害的库,叫做 pandas。它就像是个魔术师,能轻松地把 Excel 文件里的表格数据变到我们的程序里来,让我们能方便地处理和分析。

接下来,就是数据处理啦。想象一下,我们手上有个大表格,里面什么都有。但是用户可能只关心其中的几列,比如日期、销售额和访客数。所以我们就得从这个大表格里,把这几列数据挑出来,准备画图表用。

数据清洗也很重要哦。你想啊,数据里有时候会有一些小错误,比如日期写错了。所以,我们得仔细检查这些数据,把错误的地方修正过来,确保数据的准确性。


然后,就是画图表啦!这时候,我们会用到另一个强大的库,叫做 matplotlib。它就像是个画家,能根据我们的数据,画出各种各样的图表来,比如柱状图、折线图和饼状图。

最后,为了让图表看起来更漂亮、更容易懂,我们还会对图表进行一些定制。比如,加上标题、标签和图例,这样别人一看就能明白图表的意思啦。


整个过程就像是变魔术一样,把一堆原始的数据变成了漂亮的图表,让我们能一眼就看出里面的规律和趋势。是不是很有趣?

结尾


AI 智能助手作为当代科技的杰出代表,已逐渐渗透到我们生活的各个角落。它们凭借强大的数据处理、分析能力和高效的工作机制,为用户带来了前所未有的便捷体验。无论是日常生活中的琐事管理,还是工作中的复杂任务处理,AI 智能助手都展现出了其独特的价值和潜力。随着技术的不断进步和小浣熊的不断学习,我相信它将会成为一个越来越懂我、越来越有用的智能助手。

发布于: 刚刚阅读数: 6
用户头像

多啦A梦

关注

还未添加个人签名 2023-04-17 加入

还未添加个人简介

评论

发布
暂无评论
日常办公就选小浣熊,YYDS_AI_多啦A梦_InfoQ写作社区