法国 mixtral 一种具有开放权重的高质量稀疏专家混合模型

2024-12-12
北京
本文字数：503 字
阅读完需：约 2 分钟

Mixtral 是一种具有开放权重的高质量稀疏专家混合模型 (SMoE)。根据 Apache 2.0 许可。Mixtral 在大多数基准测试中都优于 Llama 2 70B，推理速度提高了 6 倍。它是最强大的开放权重模型，具有宽松的许可证，也是成本/性能权衡方面的最佳模型。特别是，它在大多数标准基准测试中匹配或优于 GPT3.5。

Mixtral 的特点

可以优雅地处理 32k 令牌的上下文。
可以处理英语、法语、意大利语、德语和西班牙语。
在代码生成方面表现出强大的性能。

基于 Hugging Face Transformers 使用 mixtral

## Use a pipeline as a high-level helperfrom transformers import pipeline
def test_mixtral():    pipe = pipeline("text-generation", model="mistralai/Mixtral-8x7B-Instruct-v0.1")    pipe("请为google编写web自动化测试用例，使用pytest page object设计模式，断言使用hamcrest")

复制代码

使用 langchain 调用 mixtral

def test_mixtral():    llm = Ollama(model="mixtral", base_url="http://localhost:11434")    r = llm.invoke('请为google编写web自动化测试用例，使用pytest page object设计模式，断言使用hamcrest')    debug(r)

复制代码

总结

Mixtral 是一种具有开放权重的高质量稀疏专家混合模型。

发布于: 刚刚阅读数: 5

测试人

关注

专注于软件测试开发 2022-08-29 加入

霍格沃兹测试开发学社，测试人社区：https://ceshiren.com/t/topic/22284

发布

暂无评论

创作场景

法国 mixtral 一种具有开放权重的高质量稀疏专家混合模型

Mixtral 的特点

基于 Hugging Face Transformers 使用 mixtral

使用 langchain 调用 mixtral

总结

测试人

评论