写点什么

[Huggingface] 系列文章 (1)- 认识 Transformers

作者:alexgaoyh
  • 2023-07-20
    河南
  • 本文字数:987 字

    阅读完需:约 3 分钟

背景

  本文是[Huggingface]系列文章的第一篇,期望通过如下的介绍,向用户展示[Huggingface]可以做到哪些事情。

环境安装

  分为三个代码段落,首先使用 conda 初始化 python 环境,其次安装 transformers,最后使用 sentiment-analysis 的文本分类任务。


conda create -n huggingface python=3.8conda activate huggingface
复制代码


pip install transformers -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码

模型测试

  由于国内网络环境的限制,作者在实际执行过程中,经常出现超时情况,可以将模型手动下载后进行处理。

文本分类

  如上所述网络问题,故附上模型下载,将模型下载至本地后指定模型路径,如下所示。


mkdir huggingfacecd huggingfacevim sentiment-analysis.py
from transformers import pipeline classifier = pipeline("sentiment-analysis", model="/home/alex/huggingface/model/distilbert-base-uncased-finetuned-sst-2-english") result = classifier("I've been waiting for a HUggingface course my whole life.") print(result) python sentiment-analysis.py
复制代码


执行结果如下图所示,如图片无法正常查看的话, 点击此处访问


文本生成

  针对文本生成任务,同样可以采用如上的方式,模型下载


from transformers import pipeline
generate = pipeline("text-generation", model="/home/alex/huggingface/model/bloomz-1b1")result = generate("我的英文名是alexgaoyh,我喜欢打篮球,", max_new_tokens=100)print(result)
复制代码


执行结果如下图所示,如图片无法正常查看的话, 点击此处访问


常见问题

  在环境安装过程中,发现部分文章只介绍了安装 transformers,对其可能需要的 tensorflow、PyTorch 并没有提及。


  在运行代码示例的过程中,部分文章介绍会自动进行模型下载,但是受国内网络环境的影响,并不能很好的进行模型下载,故本文提前将模型下载完毕,并指定位置。


  pipeline 中可以显示指定其他的模型进行使用,而不一定非要是默认的模型,可以在 HuggingFace 的模型库中进行下载。

参考

  1. https://huggingface.co/docs/transformers/v4.27.2/zh/quicktour

  2. https://zhuanlan.zhihu.com/p/448852278

  3. https://gitee.com/alexgaoyh/pap-docs


发布于: 刚刚阅读数: 4
用户头像

alexgaoyh

关注

DevOps 2013-12-08 加入

https://gitee.com/alexgaoyh

评论

发布
暂无评论
[Huggingface]系列文章(1)-认识Transformers_文本分类_alexgaoyh_InfoQ写作社区