这里是使用LlamaIndex的入门示例。首先,确保您已经遵循安装步骤。

###下载

LlamaIndex示例可以在LlamaIndex存储库的“示例”文件夹中找到。我们首先要下载这个“示例”文件夹。一种简单的方法是克隆存储库:

$ git clone https://github.com/jerryjliu/llama_index.git

接下来,导航到您新克隆的存储库,并验证内容:

$ cd llama_index
$ ls
LICENSE                data_requirements.txt  tests/
MANIFEST.in            examples/              pyproject.toml
Makefile               experimental/          requirements.txt
README.md              llama_index/             setup.py

现在我们要导航到以下文件夹:

$ cd examples/paul_graham_essay

其中包含LlamaIndex示例,围绕Paul Graham的文章“我做了什么”。在TestEssay.ipynb中已经提供了一套全面的示例。为了本教程的目的,我们可以专注于让LlamaIndex起步的简单示例。

###构建和查询索引

使用以下内容创建一个新的.py文件:

from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader

documents = SimpleDirectoryReader('data').load_data()
index = GPTVectorStoreIndex.from_documents(documents)

这将在data文件夹中构建一个索引(在这种情况下,只包含文章文本)。然后运行以下内容:

query_engine = index.as_query_engine()
response = query_engine.query("What did the author do growing up?")
print(response)

您应该得到类似以下内容的响应:作者写了短篇小说,并试图在IBM 1401上编程。

###使用日志查看查询和事件

在Jupyter笔记本中,您可以使用以下片段查看信息和/或调试日志:

import logging
import sys

logging.basicConfig(stream=sys.stdout, level=logging.DEBUG)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

您可以将级别设置为DEBUG以获得详细输出,或使用level=logging.INFO以获得较少的输出。

###保存和加载

默认情况下,数据存储在内存中。 要持久化到磁盘(在./storage下):

index.storage_context.persist()

要从磁盘重新加载:

from llama_index import StorageContext, load_index_from_storage

#重建存储上下文
storage_context = StorageContext.from_defaults(persist_dir="./storage")
#加载索引
ind### 下一步

就是这样!要了解更多关于LlamaIndex功能的信息,请查看左侧的众多“指南”。如果您有兴趣进一步探索LlamaIndex的工作原理,请查看我们的[入门指南](/guides/primer.rst)。

此外,如果您想玩示例笔记本,请查看[此链接](/reference/example_notebooks.rst)。