首页二次元正文

ollama (ollama github)

二次元 2024-09-15 74

本文目录导航：

ollama-python-Python极速部署Llama 3等大型言语模型最简双方法
AI干货分享：PaddlePaddle官网九大NLP模型清点
经常使用LM Studio在本地运转LLM完整教程

ollama-python-Python极速部署Llama 3等大型言语模型最简双方法

Ollama Python 是一个方便的工具，专为极速部署和本地运转大型言语模型而设计，例如Meta Llama 3、Phi 3、Mistral和Gemma等。

Meta Llama 3 是Meta Inc. 推出的尖端模型系列，提供了8B和70B参数选项，特意针对对话和聊天场景启动了优化，其性能在泛滥开源聊天模型中体现杰出。

为了成功高效的资源应用，Ollama Python 提供了流式照应性能。

只要将stream=True设置在函数调用中，并将其转换为Python生成器，即可按需失掉照应的每个部分，这样可以清楚优化计算效率。

该库的API设计精良，基于Ollama REST API，使得开发者能够轻松地与服务交互，构建定制客户端。

创立自定义客户端时，可以应用诸如列表展现、复制、删除和嵌入等性能来满足特定运行的需求。

关于异步操作的支持，Ollama Python库准许你经过设置stream=True，将函数调用调整为前往Python异步生成器，这在处置大规模数据或须要高并发处置的场景中尤为关键。

但是，虽然性能弱小，但也要留意潜在的失误。

在经常使用环节中，任何恳求前往失误形态或在流式传输中检测到疑问，Ollama Python库都会抛出意外，确保了稳固和牢靠的经常使用体验。

总之，Ollama Python库为部署和治理大型言语模型提供了一个既高效又灵敏的平台，无论是在本地还是在须要高性价比GPU资源的环境下，都能简化开发者的操作流程。

ollama (ollama github)

AI干货分享：PaddlePaddle官网九大NLP模型清点

引言人造言语处置（NLP）关键是钻研成功人与计算机之间用人造言语启动有效通讯的各种实践和方法。

基于神经网络的深度学习技术具有弱小的表白才干、端到端处置疑问的才干，因此在NLP义务的运行上越来越宽泛和有效。

近日，网络PaddlePaddle开源了语义示意模型ERNIE，在多个中文NLP义务上体现逾越了谷歌的BERT（请参考链接），展现了网络在NLP技术的上游才干，同时也标明PaddlePaddle作为国际目前惟一性能完备的深度学习平台，在不时得夯实框架才干,并引领技术提高。

实践上除了ERNIE，PaddlePaddle官网还有很多其余的NLP模型，笼罩了包括语义示意、语义婚配、阅读了解、机器翻译、言语模型、情感偏差剖析、词法剖析等各项NLP义务。

本文将对这些模型做一些梳理和引见。

语义示意-ERNIE常识增强的语义示意模型ERNIE（EnhancedRepresentationthroughkNowledgeIntEgration）经过对词、实体等语义单元的掩码，使得模型学习完整概念的语义示意。

相较于BERT学习原始言语信号，ERNIE间接对先验语义常识单元启动建模，增强了模型语义示意才干。

ERNIE模型自身坚持基于字特色输入建模，使得模型在运行时不须要依赖其余消息，具有更强的通用性和可裁减性。

相对词特色输入模型，字特色可建模字的组合语义，例如建模白色，绿色，蓝色等示意色彩的词语时，经过相反字的语义组合学到词之间的语义相关。

此外，ERNIE的训练语料引入了多源数据常识。

除了百科类文章建模，还对资讯资讯类、论坛对话类数据启动学习，这里重点引见下论坛对话建模。

关于对话数据的学习是语义示意的关键路径，往往相反回复对应的Query语义相似。

基于该假定，ERINE驳回DLM（DialogueLanguageModel）建模Query-Response对话结构，将对话Pair对作为输入，引入DialogueEmbedding标识对话的角色，应用DialogueResponseLoss学习对话的隐式相关，经过该方法建模进一步优化模型语义示意才干。

ERNIE在言语推断、语义相似度、命名实体识别、情感剖析、问答婚配等人造言语处置（NLP）各类中文义务上的验证显示，模型成果片面逾越BERT，如下表所示。

名目地址：ERNIE:语义婚配-DAM,AnyQ-SimNet语义婚配是一种用来权衡文本相似度的NLP义务。

很多NLP的义务可以转化为语义婚配疑问。

比如搜查可以以为是查问词与文档之间的语义婚配疑问，对话系统、智能客服可以以为是疑问和回答之间的语义婚配疑问。

PaddlePaddle官网提供了两种语义婚配相关的模型：DAM和AnyQ-SimNet。

深度留意力婚配网络DAM（DeepAttentionMatchingNetwork）DAM是一个齐全基于Attention机制的神经婚配网络。

DAM的动机是为了在多轮对话中，捕捉不同颗粒度的对话元素中的语义依赖，从而更好地在多轮高低文语境中回复。

它可用于检索式聊天机器人多轮对话中应对的选用。

DAM受启示于机器翻译的Transformer模型。

将Transformer关键的留意力机制从两个方面启动拓展，并将其引入到一个一致的网络之中。

（1）自留意力机制（Self-Attention）经过从词嵌入中叠加留意力机制，逐渐捕捉不同颗粒度的语义示意。

这些多粒度的语义示意有助于探求高低文和回答的语义依赖。

（2）互留意力机制（Cross-Attention）贯通于高低文和回答的留意力机制，可以捕捉不同语段对的依赖相关，从而在多轮高低文的婚配回答中为文本相关提供互补消息。

DAM模型网络结构该模型在Ubuntu和豆瓣对话两个语料库上测试了多轮对话义务，如下表所示，相比其余模型有最优的成果。

DAM模型的成果对比PaddlePaddle开源的DAM名目提供了数据预备、模型训练和推理等具体的运行步骤。

该名目标地址为：是网络自主研发的语义婚配框架，该框架在网络内有宽泛的运行，关键包括BOW、CNN、RNN、MM-DNN等内围网络结构方式，同时基于该框架也集成了学术界干流的语义婚配模型。

经常使用SimNet构建出的模型可以方便的添加AnyQ系统中，增强AnyQ系统的语义婚配才干。

Paddle版本Simnet提供了BOW，CNN，LSTM及GRU四种网络成功，可以经过性能文件的方式灵敏选用您须要的网络，损失函数，训练方式。

PaddlePaddle官网提供了完整的数据预备、训练和推理的相关经常使用方法。

SimNet名目链接：阅读了解-DuReader机器阅读了解是指让机器像人类一样阅读文本，提炼文本消息并回答相关疑问。

对人类而言，阅读了解是失掉外部常识的一项基本且关键的才干。

雷同，对机器而言，机器阅读了解才干也是新一代机器人应具有的基础才干。

DuReader是一个处置阅读了解疑问的端到端模型，可以依据已给的文章段落来回答疑问。

模型经过双向Attention机制捕捉疑问和原文之间的交相互关，生成Query-Aware的原文示意，最终基于Query-Aware的原文示意经过PointNetwork预测答案范围。

DuReader模型在最大的中文MRC开明数据集——网络阅读了解数据集上，到达了以后最好成果。

该数据汇聚焦于回答实在环球中开明疑问，相比其余数据集，它的好处包括实在的疑问、实在的文章、实在的回答、实在的场景和翔实的标注。

DuReader受启示于三个经典的阅读了解模型（Bi-DAF、Match-LSTM和R-NET），是一个双向多阶段模型，共有5层：词嵌入层——用预训练词嵌入模型将每一个词映射到一个向量上编码层——用双向LSTM网络为每一个疑问和段落的位置抽取高低文消息Attentionflow层——耦合疑问和高低文向量，为高低文中的每一个词生成query-aware特色向量Fusion层——应用双向LSTM网络捕捉高低文的词之间的相互消息解码层——经过疑问的attention池化的answerpoint网络定位答案在段落中的位置。

PaddleGithub链接：机器翻译-TransformerTransformer最早是谷歌提出的一种用以成功机器翻译等Seq2Seq学习义务的一种全新网络结构，它齐全经常使用Attention机制来成功序列到序列的建模，相比于以往NLP模型里经常使用RNN或许编码-解码结构，具有计算复杂度小、并行度高、容易学习长程依赖等好处,全体网络结构如图1所示。

图1：Transfomer模型结构Encoder由若干相反的layer重叠组成，每个layer关键由多头留意力（Multi-HeadAttention）和全衔接的前馈（Feed-Forward）网络这两个sub-layer构成。

Multi-HeadAttention在这里用于成功Self-Attention，相比于方便的Attention机制，其将输入启动多路途性变换后区分计算Attention的结果，并将一切结果拼接后再次启动线性变换作为输入。

参见图2，其中Attention经常使用的是点积（Dot-Product），并在点积后启动了scale的处置以防止因点积结果过大进入softmax的饱和区域。

Feed-Forward网络会对序列中的每个位置启动相反的计算（Position-wise），其驳回的是两次线性变换两边加以ReLU激活的结构。

图2：多头留意力（Multi-HeadAttention）此外，每个sub-layer后还施以ResidualConnection和LayerNormalization来促成梯度流传和模型收敛。

PaddlePaddle官网提供了该模型的数据预备、训练和推理等方法。

目前在未经常使用modelaverage的状况下，英德翻译basemodel和bigmodel八卡训练100K个iteration后测试BLEU值如下表所示：Transformer模型支持同步或许异步的散布式训练。

Paddle官网提供了具体的性能方法。

Github名目地址：言语模型-LSTM，GRURNN、LSTM和GRU是深度学习在NLP中运行的基础言语模型。

RNN模型在同一个单元中，每个时辰应用以后和之前输入，发生以后时辰的输入，能够处置必定时序的疑问，但是遭到短时记忆影响，很难将消息从较早的期间传到较晚的期间。

LSTM经过引入门结构（forget，input，output三种门结构），能够将序列的消息不时传递下去，能够将较早的消息也引入到较晚的期间中来，从而客服短时记忆。

GRU与LSTM十分相似，但是只要两个门（update，reset），因此参数更少，结构方便，训练更方便。

Paddle提供了基于PennTreeBank(PTB)数据集的经典循环神经网络LSTM言语模型成功，经过学习训练数据中的序列相关，可以预测一个句子发生的的概率。

Paddle也提供了基于PennTreeBank(PTB)数据集的经典循环神经网络GRU言语模型成功，在LSTM模型基础上做了一些简化，坚持成果基本持平的前提下，模型参数更少、速度更快。

Github链接：情感偏差剖析-Senta情感偏差剖析针对带有客观形容的中文文本，可智能判别该文本的情感极性类别并给出相应的置信度。

情感类型分为踊跃、消极、中性。

情感偏差剖析能够协助企业了解用户生产习气、剖析热点话题和危机舆情监控，为企业提供有力的决策支持。

Senta模型是目前最好的中文情感剖析模型，可智能判别中文文本的情感极性类别并给出相应的置信度。

它蕴含有以下模型：?Bow(BagOfWords)模型--是一个非序列模型。

经常使用基本的全衔接结构。

?浅层CNN模型--是一个基础的序列模型，能够处置变长的序列输入，提取一个部分区域之内的特色。

?单层GRU模型--序列模型，能够较好地解序列文本中长距离依赖的疑问。

?单层LSTM模型--序列模型，能够较好地处置序列文本中长距离依赖的疑问。

?双向LSTM模型--序列模型，经过驳回双向LSTM结构，更好地捕捉句子中的语义特色。

网络AI平台下情感偏差剖析模块驳回此模型启动训练和预测。

下图展现了这种模型的原理。

基于Bi-LSTM的情感分类模型总体来说，基于Bi-LSTM的情感分类模型包括三层：单词语义层，句子语义层，输入层。

1.单词语义层，关键是将输入文本中的每个单词转化为延续的语义向量示意，也就是单词的Embedding。

2.句子语义层，经过Bi-LSTM网络结构，将单词语义的序列转化为整个句子的语义示意。

3.输入层，基于句子语义计算情感偏差的概率。

在PaddlePaddle的该模型名目地址上，给进去在C-API目录下给出了bilstm_net模型的下载脚本，可供用户下载经常使用（模型可支持C-API、python两种预测方式），该模型在网络自建数据集上的成果分类准确率为90%。

Github名目地址：中文词法剖析-LACLAC是一个联结的词法剖析模型，能够全体性地成功中文分词、词性标注、专名识别等NLP义务。

LAC既可以以为是LexicalAnalysisofChinese的首字母缩写，也可以以为是LACAnalyzesChinese的递归缩写。

中文分词--是将延续的人造言语文本，切分红具有语义正当性和完整性的词汇序列的环节词性标注（Part-of-Speechtagging或POStagging）--是指为人造言语文本中的每个词汇赋予一个词性的环节命名实体识别（NamedEntityRecognition简称NER）--即专名识别，是指识别人造言语文本中具有特定意义的实体，关键包括人名、地名、机构名、期间日期等LAC基于一个重叠的双向GRU结构（Bi-GRU-CRF），在长文本上准确复刻了网络AI开明平台上的词法剖析算法。

网络结构如下图所示。

用两个Bi-GRU重叠的Bi-GRU-CRF网络Bi-GRU是GRU网络的一种拓展，由一个反向的GRU与一个正向的GRU耦合而成，将一个完整的句子作为。

两个GRU的输入相反，但是训练方向相反。

两个网络的结果拼接以后作为输入。

重叠多个Bi-GRU可以构成深度的网络，从而能够促成语义的示意才干。

本模型重叠了两层Bi-GRU。

之后，将Bi-GRU的输入连到一个全衔接层。

它将Bi-GRU层的输入转为一个多维度向量，向量的维度是一切或许标签的数量。

整个网络最上面，经常使用了CRF（条件随机场）对最后的标签做联结解码。

成果方面，分词、词性、专名识别的全体准确率95.5%；独自评价专名识别义务，F值87.1%（准确90.3，召回85.4%），总体略优于开明平台版本。

在成果优化的基础上，LAC的模型繁复高效，内存开支不到100M，而速度则比网络AI开明平台提高了57%。

Github链接：官网模型库Github地址名目地址：

经常使用LM Studio在本地运转LLM完整教程

开源AI模型畛域正在迅速开展，其中一些模型在特定畛域甚至能够逾越GPT-4这样的顶级生成式AI聊天机器人。

关于那些宿愿在本地计算机上运转这些模型的人来说，选用适宜的工具变得尤为关键。

在泛滥选项中，LM Studio是一个有目共睹的选用，它提供了一种简便的、收费的方法来装置和经常使用开源LLM（大型言语模型）。

虽然LM Studio并非开源，但其性能和易用性使其成为本地测试和评价开源LLM的现实工具。

首先，访问“”网站，下载适宜您操作系统的版本并装置。

LM Studio准许您选用要装置的LLM模型，这可以经过阅读主窗口中介绍的社区模型来成功，或许应用HuggingFace上的搜查性能，输入关键词找到特定的模型。

在装置环节中，留意检查模型的大小，确保下载的文件与您的需求和网络环境相婚配。

LM Studio会基于您的计算机性能提供兼容性倡导，并列出在您计算机上运转的模型列表。

经过点击“兼容性猜想”或阅读左侧的模型，您可以进一步挑选出适宜您计算机规格的模型版本。

选用适宜的模型后，下载并装置成功。

在LM Studio界面中，选用顶部的下拉菜单来加载模型，而后在左侧的聊天气泡中输入您的查问。

性能界面准许您调整模型的参数，包括高低文溢出战略、聊天外观，以及配件设置。

在配件设置中，您可以在CPU和GPU之间启动选用，以优化模型的运转速度和准确性。

您还可以调整CPU线程数，以顺应您的本地计算机性能。

成功性能后，即可在“USER”字段中输入查问并取得“AI”的照应。

LM Studio提供了一种直观、用户友好的方式来体验和应用开源LLM模型，这为那些宿愿在本地环境中构建和部署聊天机器人或主机的人提供了便利。

总之，LM Studio是一个易于上手、性能弱小的本地测试工具，关于那些宿愿在本地计算机上探求和应用开源LLM模型的人来说，它是一个极具吸引力的选用。