这里的小浣熊不是咱们耳熟能详的干脆面,而是商汤的办公小浣熊——基于商汤大语言模型的大模型原生数据分析产品,旨在通过先进的人工智能技术优化和提升工作效率。
办公小浣熊已经为数十万用户提供智能辅助服务,获得了广泛的好评。在实际应用中,办公小浣熊广泛应用于财务分析、商业分析、销售预测、市场分析等多个领域,为用户提供了强大的数据支持。
一、注册登录
1、注册登录之后,就可以看到两种小浣熊——代码和办公。选择办公小浣熊。
2、需要选择一种数据源进行分析,支持本地文件.xlsx/.xls/.csv/.txt/json/word(beta)/pdf(beta)/ppt(beta)/sql(限免)/图片(限免) 等类型文件。也可以导入数据库文件和数据管理。单次≤3 个文件,单个文件≤20M,单个会话≤10 个文件/80M。
二、数据分析
1、根据上传的 Excel 文件进行数据分析。上传一个试题库,然后让小助手对试题进行简单分析。
2、左侧边生成代码边进行分析,大概 3 分钟左右就可以归类分析。内容如下:
3、接着可以让小助手把分析结果生成图表展示。
4、可以看到单选题的分布生成是空白的,有些问题,这里可以让小助手再重新生成下。这样就比文字更加直观了。
5、可以继续更改图表的参数,包括图表大小、颜色方案以及添加了网格线,以提高可读性和美观性。
6、接着上传一份自己的工作任务表格,让小助手帮忙给我统计下每一类活动的时间长度。
7、小助手会对表格里的内容自行检查。如下:
在检查了Excel文件中的各个工作表后,我发现"activities list"和"Sheet3"包含了活动类型(Activity - Type)和工时(Activity - Duration)的数据。这些数据适合用于按活动类型进行分类分析工时。
接下来,我将使用"activities list"工作表中的数据来进行这项分析。这个工作表包含了活动类型和相应的工时数据,正好符合我们的需求。我将计算每种活动类型的总工时。
复制代码
8、之后会成长 Python 代码来进行分析。不过这些代码不支持在其上直接修改。
# 使用 "activities list" 工作表进行分析
activities_df = pd.read_excel(file_path, sheet_name='activities list')
# 确保工时数据是时间格式
activities_df['Activity - Duration'] = pd.to_timedelta(activities_df['Activity - Duration'])
# 计算每种活动类型的总工时
total_duration_by_type = activities_df.groupby('Activity - Type')['Activity - Duration'].sum()
# 将总工时转换为小时
total_hours_by_type = total_duration_by_type.dt.total_seconds() / 3600
total_hours_by_type
复制代码
9、不规则的数据,小助手还会进行数据的统一格式进行处理,工时数据列包含了多种格式的时间值,例如 '17:30', '02:00', '04:00' 等,以及一些 NaN 值。这些时间值看起来是以小时和分钟的格式表示的,但没有遵循统一的 hh:mm:ss 格式。
小助手通过下面的 Python 代码将这些时间值转换为统一的 hh:mm:ss 格式,然后再进行总工时的计算。
# 将工时数据转换为统一的 hh:mm:ss 格式
def convert_to_hh_mm_ss(duration):
if pd.isna(duration):
return None
parts = duration.split(':')
if len(parts) == 2:
hours, minutes = parts
return f"{int(hours):02d}:{int(minutes):02d}:00"
return duration
activities_df['Activity - Duration'] = activities_df['Activity - Duration'].apply(convert_to_hh_mm_ss)
# 再次尝试将转换后的数据转换为时间格式
activities_df['Activity - Duration'] = pd.to_timedelta(activities_df['Activity - Duration'])
# 计算每种活动类型的总工时
total_duration_by_type = activities_df.groupby('Activity - Type')['Activity - Duration'].sum()
# 将总工时转换为小时
total_hours_by_type = total_duration_by_type.dt.total_seconds() / 3600
total_hours_by_type
复制代码
10、最后智能分析的结果如下:
11、进一步根据上文分析的内容快速来生成可视化的图表——条形图、饼图、曲线图等可以根据自己的需求随意切换,相当灵活。
12、还可以让小助手根据分析的结果写一个工作汇报。虽然有些套话,但自己再润色下还是可以给领导汇报的。
尊敬的领导:
根据对活动数据的分析,我们得出了以下结论:
活动类型分布:我们的数据涵盖了多种活动类型,包括内部会议、客户拜访、技术交流等。每种活动类型都有其特定的工时分配。
主要工时消耗:在所有活动类型中,“TC-老客户售后”和“内部会议与培训”占据了最多的工时,分别为520.25小时和247小时。这表明这些活动是公司日常运营中最为重要和耗时的部分。
效率提升空间:某些活动类型如“电话”和“视频会议”所占工时较少,这可能意味着这些活动相对更高效,或者是因为其性质不需要长时间的投入。
时间管理建议:鉴于“TC-老客户售后”和“内部会议与培训”等活动的高工时消耗,建议对这些活动进行进一步的效率分析和优化,以提高整体工作效率。
未来规划:对于工时较少的活动,如“电话”和“视频会议”,可以考虑是否有提升其效率和效果的空间,或者是否有增加这些活动频率的必要,以支持公司的业务发展。
综上所述,通过对活动类型的工时分析,我们不仅能够了解公司资源的分配情况,还能够为未来的工作规划和资源配置提供数据支持。
请您审阅,如有任何问题或需要进一步的分析,请随时告知。
此致,
[您的名字]
[日期]
复制代码
同时也可以保存工作汇报到本地和数据管理。
13、如果不知道针对自己上传的文件还能做什么分析,可以参考下小助手的提示或者官方的示例。
三、其他功能
1、历史回溯——查询自己曾经进行的分析会话。
2、数据管理——可以先先把文件/文件夹上传到这里然后进行分析,也可以把分析后的结果保存在这里。
3、人设管理——默认有数据分析工程师,还可以自己创建人设。
4、导入数据库文件——对数据库表做分析
可以分析下这三张表的关系。
进而生成三者的关系图。
可以让小助手做个市场结论。
基于当前的数据和关系图,我们可以得出以下初步的市场结论:
用户购买行为:通过分析特定用户的订单历史,我们可以了解用户的购买偏好、购买频率以及他们更倾向于购买哪些产品。这有助于进行更个性化的市场营销活动。
产品销售情况:通过分析订单数据,我们可以确定哪些产品更受欢迎,哪些产品的销售量较低。这有助于调整库存、促销策略以及新产品的开发。
用户与产品的关系:通过分析哪些用户购买了哪些产品,我们可以了解不同用户群体的购买偏好。这有助于针对不同的用户群体进行更有针对性的市场营销活动。
时间因素:如果考虑订单日期,我们可以分析产品销售的季节性变化,从而更好地规划促销活动和库存管理。
地域因素:考虑到用户的注册地点,我们可以分析不同地区的市场需求,从而进行更有针对性的市场策略。
总之,通过对用户、产品和订单数据的深入分析,我们可以获得宝贵的市场洞察,从而制定更有效的市场策略。
复制代码
四、使用体验
曾经有很多人热衷学 Python 来日常办公的数据分析处理,但有了小浣熊出世,数据分析不会 Python 也能晚的起飞。
小浣熊办公助手操作界面简单直观,即使一点数据分析经验的用户也能轻松上手。支持多种数据来源,包括 Excel、CSV、JSON 等多种文件类型,方便用户导入数据进行分析。同时可以在分析过程中进行多轮的需求反馈,不断优化自己的分析结果。
支持复杂表格、多表格、多文件的理解,能够完成数据清洗、比较分析、归类分析等常见数据分析任务。能把分析的结果生成各种图表和一键报告,从此跟领导汇报不用愁。
更多的宝藏用法还要继续在实际的工作中来挖掘,这么好的工具需要让更多打工人来知晓,让技术来提升办公生产力。
评论