作者:Surendar Gajavelli 和 Abhi Patlolla 日期:2024年9月19日在 Amazon Bedrock、Amazon Q、生成性 AI、学习级别、技术指南Permalink
在 Amazon Bedrock 知识库中,SharePoint 数据源的一些相关特性包括:
访问存储在 SharePoint 中的信息。RAG 架构可以查询和检索 SharePoint 数据源中的相关信息,以根据用户输入提供上下文响应。能够从 SharePoint 中获取结构化数据、元数据和文档中的其他信息,以提供基于用户查询的相关搜索结果。支持持续同步增量 SharePoint 内容更新。为由 FM 生成的响应提供源归属信息。接下来的部分将逐步说明如何创建知识库、配置数据源并测试解决方案。
实现 Amazon Bedrock 知识库与 SharePoint 作为连接器的需要满足以下前提条件:
拥有一个 AWS 账户,并具有 AWS 身份与访问管理 (IAM) 角色和用户,具备 最小权限 来创建和管理应用程序所需的资源和组件。如果没有 AWS 账户,请参阅 如何创建和激活新的 AWS 账户?。拥有一个 Microsoft 账户 以及 Microsoft SharePoint Online 订阅,以根据本文阐述的步骤创建和发布应用程序。如无此项,请与组织管理员联系以创建供您测试的沙盒,或者在必要时创建新的账户和试用订阅以完成步骤。请按照以下步骤在 Amazon Bedrock 上设置知识库并连接 SharePoint 数据源:
登录 Amazon Bedrock 控制台,在导航窗格中选择 知识库。选择 创建知识库。在 知识库详细信息 部分,您可以选择更改默认名称并输入知识库的描述。在 IAM 权限 部分,选择一个提供 Amazon Bedrock 访问其他 AWS 服务权限的 IAM 角色。您可以让 Amazon Bedrock 创建服务角色,或选择您已创建的 自定义角色。在 选择数据源 部分,选择 SharePoint。可以选择性地为知识库添加标签。有关更多信息,请参见 标记资源。点击 下一步。在 名称和描述 部分,可以选择性地更改数据源的默认名称并输入数据源的描述。在 源 部分,提供以下信息:对于 站点 URL,输入用于抓取和索引内容的 URL。对于 域,输入与数据源关联的域名。例如,如果站点 URL 为 https//deloittedasitssharepointcom/xyzaspx,则域值应为 deloittedasits。在 高级设置 下,保持默认选择。在将数据转换为嵌入时,Amazon Bedrock 默认使用 AWS 拥有和管理的密钥对数据进行加密。如果要使用自己的 AWS 密钥管理服务 (AWS KMS) 密钥,请选择 自定义加密设置高级 并选择密钥。有关更多信息,请参见 数据摄取过程中临时数据存储的加密。
您还可以为数据源选择以下数据删除策略选项:
删除 在删除知识库或数据源资源时,删除属于数据源的所有底层数据,但向量存储本身不会被删除。注意,只有底层数据会被删除。保留 在删除知识库或数据源资源时,保留您在向量存储中的所有底层数据。有关管理知识库的更多信息,请参见 管理数据源。
风驰加速器app下载安装在 认证 部分,支持的认证方法设置为 OAuth 20。对于 租户 ID,输入您的租户 ID。请参阅本文的 Microsoft Azure 门户注册新应用程序部分以获取租户 ID。对于 AWS Secrets Manager 秘密,输入 AWS Secrets Manager,请参阅本文的 SharePoint 数据源的创建 Secrets Manager 秘密部分以获得该秘密。SharePoint 数据源需要凭证来使用 Microsoft Graph API 连接到 SharePoint Online 站点。为此,请创建一个新的 Secrets Manager 秘密。这些凭证在 SharePoint Online 站点的访问日志中不会被使用。
在 元数据设置 部分,可以选择性地选择任何您想要包含或排除的内容类型。在 内容分块和解析 部分,选择 默认。选择 下一步。在 嵌入模型 部分,选择 Titan Embeddings G1 Text 或根据需要选择其他嵌入模型。在 向量数据库 部分,选择 快速创建新向量存储 以为嵌入创建一个向量存储。选择 下一步。在 审查和创建 页面,验证所做的选择并单击 创建。知识库创建应已完成。
现在,使用 SharePoint 作为数据源的知识库已创建。但是,数据源需要进行同步,以便抓取站点 URL 并索引相关内容。
要启动此过程,在知识库详细信息页面,选择您的数据源并选择 同步。在本节中,我们将在 Microsoft Azure 门户中注册一个新应用程序。我们将在此步骤中获取租户 ID,以便在配置 Amazon Bedrock 知识库的数据源时使用。请完成以下步骤:
打开 Azure 门户,使用您的 Microsoft 账户登录。如果您没有账户,可以 创建一个 或联系您组织的管理团队。选择 新注册。提供以下信息:对于 名称,提供您的应用程序名称。我们将此应用程序称为 TargetApp。Amazon Bedrock 知识库将 TargetApp 用于连接到 SharePoint 站点以抓取和索引数据。对于 谁可以使用此应用程序或访问此 API,选择 仅限此组织中的账户lt租户名称gt 仅限 单租户。选择 注册。记下应用程序客户端ID 和目录租户ID,这在 概览 中可以找到。您稍后需要它们来满足 TargetAppClientId 和 TenantId 的要求。在导航窗格中选择 API 权限。将权限配置如下:选择 添加权限。选择 Microsoft Graph。选择 委托的权限。在 用户 部分选择 ReadAll。在 组成员 部分选择 ReadAll。在 站点 部分选择 FullControlAll。选择 添加权限。此权限允许应用程序读取您组织目录中已登录用户的数据。在选项菜单三个点中,选择 删除权限。删除原始的 读取 委托 权限。为默认目录选择 授予管理员同意。在导航窗格中选择 证书和密钥。选择 新建客户端密钥。对于 描述,输入描述,例如我的客户端密钥描述。选择 过期 的值。在生产环境中,您需要在密钥过期前手动轮换它。点击 添加。记下您新密钥的值。稍后需要用于您的客户端密钥TargetAppClientSecret。可选择选择 所有者 添加任何其他所有者。所有者将能够管理 Azure AD 应用TargetApp的权限。请按照以下步骤为连接到列为数据源中站点 URL 的 SharePoint 在线站点创建 Secrets Manager 秘密:
在 Secrets Manager 控制台,选择 存储新秘密。对于 秘密类型,选择 其他类型的秘密。对于 键/值对,输入以下内容:usernamepasswordclientIdclientSecret对于 加密密钥,选择 aws/secretsmanager。选择 下一步。在 秘密名称和描述 部分,输入秘密的名称和可选描述。在 标签中添加任何相关标签。将 资源权限 和 复制秘密 保持默认状态。选择 下一步。在 配置轮换 部分,保持默认或根据组织政策修改。选择 下一步。审阅选定的选项并选择 存储。在秘密详细信息页面,记下您的秘密 ARN 值,以便在创建 Amazon Bedrock 知识库时使用。
请按照以下步骤测试您创建的知识库:
在 Amazon Bedrock 控制台中,选择导航窗格中的 知识库。选择您创建的知识库并选择 测试。选择适当的模型进行测试,然后点击 应用。输入您对存储在 SharePoint 站点中的内容的询问。如果您创建了新的知识库并不打算进一步使用,请删除该知识库,以免在您的 AWS 账户中累积费用。有关说明,请参见 管理知识库。
在此文章中,我们展示了如何配置 Amazon Bedrock 知识库,将 SharePoint Online 作为数据源。通过将 SharePoint Online 作为数据源,员工可以使用自然语言与组织存储在 SharePoint 中的知识和数据进行交互,使得查找相关信息、提取要点和获取有价值的见解变得简单。这将显著提高组织内的生产力、决策能力和知识共享。
今天就尝试在 Amazon Bedrock 控制台 中使用此功能吧!想了解更多内容,请参见 Amazon Bedrock 知识库。
[](https//d2908q01vomqb2cloudfrontnet/f1f836cb4ea6efb
留言框-