写点什么

小浣熊你的数据处理好帮手

  • 2024-07-14
    广东
  • 本文字数:1924 字

    阅读完需:约 6 分钟

前言

发现一个宝藏级别的数据表格处理工具,这应该是我见过数据表格处理最好的 AI 了。可视化的处理过程,近乎理想的处理结果,非常安利大家去使用一下办公小浣熊。



设定人设

第一步是设定人设,使用过 AI 工具的人都知道。给 AI 设定一个人设可以使数据处理更加的精准。当你给 AI 设定了一个人设之后,他能从设定的角色出发去处理你想要的数据。



设定对应的人设就可以对数据进行更精准的处理了。



文件上传

除了基本的 AI 问答功能,最亮眼的就是他的表格处理功能呢,内部使用程序脚本对数据进行处理,脚本使用 python 语言,对数据进行处理,如果对结果不满意可以对代码进行调整或者使用语言说明对结果进行调整。



询问 AI 什么是观察者设计模式,测试一下上传文件之后的




样例数据

官网提供了一些样例数据进行统计,使用样例子数据可以对结果进行分析和统计。



这款软件对数据统计的和展示还是做的非常的出色的,数据预览非常正常。可视化做的非常不错对细节把控和交互体验都做的很出色,目前我使用的市面上的应该算是最好的。



查漏补缺

说明你的需求之后,开始输出对文档进行操作的 Python 脚本。



简单测试下对文档一些查漏补缺的功能,计算统计结果非常准确。




测试雷达数据

这一小节是使用雷达数据进行统计操作,试下对于繁琐的数据表格是否操作起来更加的简便快捷。首先是选择测试数据表格,先对文件进行预览。



然后对数据进行一个统计计算,这里加载完成之后还会对文档进行一个统计说明。



打印图表

选择你需要处理的列名,然后对其进行统计。下面的操作步骤主要是一步一步对结果进行一个优化。系统会友好的提示你,进一步对数据进行精确定位。




操作的 python 脚本,从脚本的结果来看就像一个人对表格数据进行统计计算,如果你理解代码,那么非常方便可以自己拿着代码进行修改,以适应更复杂的场景,如果你不懂也没关系,可以使用语言,对结果进行不断地纠错改正。

统计代码

import matplotlib.pyplot as pltimport numpy as np
# Filter data for the year 1950data_1950 = data[data['year'] == 1950]
# Select the columns for radar chartlabels = data_1950['positionDisplayOrder'].unique()stats = data_1950.groupby('positionDisplayOrder')['positionNumber'].mean().values
# Number of variables we're plotting.num_vars = len(labels)
# Compute angle of each axis in the plot. angles = np.linspace(0, 2 * np.pi, num_vars, endpoint=False).tolist()
# The plot is circular, so we need to "complete the loop" and append the start to the end.stats = np.concatenate((stats, [stats[0]]))angles += angles[:1]
# Plotfig, ax = plt.subplots(figsize=(6, 6), subplot_kw=dict(polar=True))ax.fill(angles, stats, color='blue', alpha=0.25)ax.set_yticklabels([])ax.set_xticks(angles[:-1])ax.set_xticklabels(labels)
# Display the radar chartplt.title('1950年比赛结果的雷达模型')plt.show()
复制代码

这是统计打印出来的结果图,看着这个图片感觉似曾相识,不过这都是数据渲染导致的。修改数据之后,结果也随着变化。



线性回归

对结果进行统计计算,这是小浣熊数据处理的另一个优点。



统计代码

进行数据统计的代码,简单一目名了。

from sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegressionfrom sklearn.metrics import mean_squared_error, r2_score
# 定义特征变量和目标变量X = df[['房龄(年)', '楼层(层)', '房间平方(m2)', '配套电梯']]y = df['房价(万)']
# 划分训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建线性回归模型model = LinearRegression()
# 训练模型model.fit(X_train, y_train)
# 预测测试集y_pred = model.predict(X_test)
# 计算模型的均方误差和决定系数R^2mse = mean_squared_error(y_test, y_pred)r2 = r2_score(y_test, y_pred)
mse, r2
复制代码



总结

从整体的操作统计图表统计结果。对数据进行一个查漏补缺,整个操作下来。给我的感觉。对数据处理操作这一块,他还是做得非常好的,目前来说,整体体验非常的好。起初我也觉得这个细分的领域应该没有特别大的。出奇的点体验下来之后发现厂家还是做了很大的优化,很用心,利用 AI 对数据进行一个处理。而且数据操作过程非常的可视化。比起普通的一些 AI 主导的模型,上传文件可能只是一个辅助功能,但是小浣熊这个办公软件对于数据处理来说,这个细分领域可以达到了最优的结果。非常的直观,操作简便,在产品上面应该是下了很多功夫的。

引用

https://raccoon.sensetime.com/office

https://raccoon.sensetime.com/office/examples

发布于: 刚刚阅读数: 9
用户头像

生命中任何一件事都值得全力以赴 2019-08-27 加入

世界因你而不同

评论

发布
暂无评论
小浣熊你的数据处理好帮手_数据处理_查拉图斯特拉说_InfoQ写作社区