跳到主要内容

标记为[mistal-7b]的问题

这个标签没有使用指南。

mistal-7b公司
70问题
筛选依据
排序依据
标记为
0 投票
1 回答
51 意见

如何将Mistral模型永久构建到Ollama中?

我想创建一个Dockerfile,在其中我将运行内置Mistral模型的Ollama。现在,我只实现了这一点:当我运行Ollama时,它会在一个Dockerfile中下载Mistral(。。。
mazix的用户头像
  • 2,574
1 投票
1 回答
25 意见

使用Ollama流式传输时,Mistral7b响应以额外的前导空格开始

当我用Ollama流式传输mistal7b LLM的响应时,它在第一个流式块的左侧有一个额外的空间。下面是我的代码:进口奥拉玛流=ollama.chat(model='mistal',...
noocoder777的用户头像
0 投票
0 答案
21 意见

我在Streamlit中的LLM应用程序(使用python)需要更长的时间来生成响应

我正在使用Ollama、Langchain、RAG和streamlit创建LLM应用程序。我使用Mistral作为我在Ollama的LLM模型。然而,在将PDF文件上传到streamlit中后,需要花费大量时间。。。
Urvesh的用户头像
-1 投票
0 答案
20 意见

RAG模型错误:Mistral7B没有给出正确的响应,当在本地部署时,每次都会返回相同的无关响应

我正在创建一个RAG模型,它为用户创建对话聊天机器人,加载我以docx格式创建的自定义知识库。我在这里用了草垛而不是骆驼索引,还有电灯。。。
Pawan Kumar的用户头像
0 投票
0 答案
54 意见

利用LLava v1.6 Mistral模型对亚马逊SageMaker的推断

我在Amazon SageMaker中部署了以下模型llava-hf/llava-v1.6-mistral-7b-hf,只需从模型卡粘贴部署代码(https://huggingface.co/llava-hf/llava-v1.6-mistral-7b-hf). ...
Aleksandar Cvjetic的用户头像
1 投票
1 回答
59 意见

需要使用Mistral 7B指令对定制RAG项目进行澄清

我是Langchain初学者。我的任务是为一个假剧场的应用程序设置一个人工智能助手,我们称之为SignStage,它有两个大厅a和B,每个剧本每天在。。。
NIKOMAHOS的用户头像
0 投票
1 回答
41 意见

Mistral7B指令输入大小受限

最近,我微调了Mistral 7B Instruct v0.3模型,并将其部署在AWS Sagemaker端点上。但出现了如下错误:从主服务器接收到客户端错误(422),消息为“{”。。。
最大值's用户头像
0 投票
1 回答
24 意见

TGI不参考模型权重

我的服务器代理不允许我转到“拥抱的脸”。因此,我将Mistral 7B砝码从GitHub下载到另一台计算机上,将其发送到服务器,然后清除内容,$tar-电视。。。
胡安奇托的用户头像
0 投票
0 答案
21 意见

QLora使用HF中的peft和自定义类进行二进制分类

我正在为二进制分类微调一个误用的7B LLM模型。我意识到这可能是一种过度杀戮;但我们正在进行一些实验。到目前为止,我已经使用了HuggingFace库,如peft和。。。
kms的用户头像
  • 1,982
1 投票
1 回答
125 意见

通过拥抱面部端点使用Mistral AI执行函数调用

我正在尝试使用Mistral AI通过Hugging Face端点执行函数调用。Mistral AI需要特定字符串格式的输入(助手:…\n用户:…)。然而,输入。。。
Neo_clown的用户头像
0 投票
0 答案
69 意见

如何修复RuntimeError:张量的元素0不需要grad并且没有grad_fn

我正在尝试使用自定义csv数据集来微调模型:TheBloke/Mistral-7B-Instruction-v0.1-GPTQ。我进行了数据预处理,并将数据集分成训练集、验证集和测试集,然后。。。
市长用户头像
  • 19
0 投票
1 回答
136 意见

在Mistral模型中使用Llama_index

我是大语言模型(LLM)领域的新手,所以如果我的解释不清楚,我道歉。我有一个在私有云中运行的Mistral模型,我有URL和模型名称。URL=。。。
khaoula的用户头像
0 投票
0 答案
105 意见

开源LLM重复令牌直到达到最大令牌-如何修复?

我正在使用一个开源语言模型(LLM)来生成葡萄牙语文本,我遇到了一个问题,该模型不断重复标记,直到标记的最大数量达到。。。
Miguel Casagrande的用户头像
0 投票
0 答案
69 意见

Pinecone ERROR Vector维度768与索引384的维度不匹配

我正在使用HuggingFace、Mistral、LangChain和Pinecone构建聊天机器人RAG。我有一个Python脚本来监视MongoDB集合中的更改,并将数据作为向量发送到Pinecone。导入操作系统...
Gabriel Lisboa的用户头像
0 投票
0 答案
33 意见

LLM模型输出在远程服务器上流式传输,但不在客户端

我设计了一个远程服务器-客户端管道,它应该在服务器上加载模型并流式传输模型的输出。目前,输出是正确流式的,但只在。。。
Phys的用户头像
  • 518

15 30 50 每页