自定义 LLM 提供商 | Flutter 框架

连接 LLM 和 LlmChatView 的协议在 LlmProvider 接口中表达

dartabstract class LlmProvider implements Listenable {
  Stream<String> generateStream(String prompt, {Iterable<Attachment> attachments});
  Stream<String> sendMessageStream(String prompt, {Iterable<Attachment> attachments});
  Iterable<ChatMessage> get history;
  set history(Iterable<ChatMessage> history);
}

LLM 可以在云端或本地，可以托管在 Google Cloud Platform 或其他云提供商上，可以是专有 LLM 或开源 LLM。任何可用于实现此接口的 LLM 或类 LLM 端点都可以作为 LLM 提供商插入到聊天视图中。AI 工具包开箱即用地提供了三个提供商，所有这些提供商都实现了将提供商插入以下所需的 LlmProvider 接口

Gemini 提供商，它封装了 google_generative_ai 包
Vertex 提供商，它封装了 firebase_vertexai 包
Echo 提供商，它是一个最小提供商示例，非常有用

要构建自己的提供商，您需要牢记以下几点来实现 LlmProvider 接口

提供完整的配置支持
处理历史记录
将消息和附件翻译到底层 LLM
调用底层 LLM
配置为了在自定义提供商中支持完全可配置性，您应该允许用户创建底层模型并将其作为参数传入，就像 Gemini 提供商所做的那样

dartclass GeminiProvider extends LlmProvider ... {
  @immutable
  GeminiProvider({
    required GenerativeModel model,
    ...
  })  : _model = model,
        ...

  final GenerativeModel _model;
  ...
}

通过这种方式，无论底层模型将来发生何种变化，您自定义提供商的用户都可以使用所有配置旋钮。

历史记录历史记录是任何提供商的重要组成部分——提供商不仅需要允许直接操作历史记录，还必须在其更改时通知侦听器。此外，为了支持序列化和更改提供商参数，它还必须支持将历史记录作为构造过程的一部分进行保存。

Gemini 提供商处理方式如下

dartclass GeminiProvider extends LlmProvider with ChangeNotifier {
  @immutable
  GeminiProvider({
    required GenerativeModel model,
    Iterable<ChatMessage>? history,
    ...
  })  : _model = model,
        _history = history?.toList() ?? [],
        ... { ... }

  final GenerativeModel _model;
  final List<ChatMessage> _history;
  ...

  @override
  Stream<String> sendMessageStream(
    String prompt, {
    Iterable<Attachment> attachments = const [],
  }) async* {
    final userMessage = ChatMessage.user(prompt, attachments);
    final llmMessage = ChatMessage.llm();
    _history.addAll([userMessage, llmMessage]);

    final response = _generateStream(
      prompt: prompt,
      attachments: attachments,
      contentStreamGenerator: _chat!.sendMessageStream,
    );

    yield* response.map((chunk) {
      llmMessage.append(chunk);
      return chunk;
    });

    notifyListeners();
  }

  @override
  Iterable<ChatMessage> get history => _history;

  @override
  set history(Iterable<ChatMessage> history) {
    _history.clear();
    _history.addAll(history);
    _chat = _startChat(history);
    notifyListeners();
  }

  ...
}

您将在此代码中注意到几件事

使用 ChangeNotifier 来实现 LlmProvider 接口中的 Listenable 方法要求
能够将初始历史记录作为构造函数参数传入
当有新的用户提示/LLM 响应对时通知侦听器
当历史记录手动更改时通知侦听器
当历史记录更改时使用新历史记录创建新的聊天

本质上，自定义提供商管理与底层 LLM 的单个聊天会话的历史记录。随着历史记录的变化，底层聊天需要自动保持最新（就像 Dart 的 Gemini AI SDK 在您调用底层聊天特定方法时所做的那样）或手动重新创建（就像 Gemini 提供商在历史记录手动设置时所做的那样）。

消息和附件

附件必须从 LlmProvider 类型公开的标准 ChatMessage 类映射到底层 LLM 处理的任何内容。例如，Gemini 提供商将 AI 工具包中的 ChatMessage 类映射到 Dart 的 Gemini AI SDK 提供的 Content 类型，如以下示例所示

dartimport 'package:google_generative_ai/google_generative_ai.dart';
...

class GeminiProvider extends LlmProvider with ChangeNotifier {
  ...
  static Part _partFrom(Attachment attachment) => switch (attachment) {
        (final FileAttachment a) => DataPart(a.mimeType, a.bytes),
        (final LinkAttachment a) => FilePart(a.url),
      };

  static Content _contentFrom(ChatMessage message) => Content(
        message.origin.isUser ? 'user' : 'model',
        [
          TextPart(message.text ?? ''),
          ...message.attachments.map(_partFrom),
        ],
      );
}

每当需要将用户提示发送到底层 LLM 时，都会调用 _contentFrom 方法。每个提供商都需要提供自己的映射。

调用 LLM

您如何调用底层 LLM 来实现 generateStream 和 sendMessageStream 方法取决于它公开的协议。AI 工具包中的 Gemini 提供商处理配置和历史记录，但对 generateStream 和 sendMessageStream 的调用最终都会调用 Dart 的 Gemini AI SDK 中的 API

dartclass GeminiProvider extends LlmProvider with ChangeNotifier {
  ...

  @override
  Stream<String> generateStream(
    String prompt, {
    Iterable<Attachment> attachments = const [],
  }) =>
      _generateStream(
        prompt: prompt,
        attachments: attachments,
        contentStreamGenerator: (c) => _model.generateContentStream([c]),
      );

  @override
  Stream<String> sendMessageStream(
    String prompt, {
    Iterable<Attachment> attachments = const [],
  }) async* {
    final userMessage = ChatMessage.user(prompt, attachments);
    final llmMessage = ChatMessage.llm();
    _history.addAll([userMessage, llmMessage]);

    final response = _generateStream(
      prompt: prompt,
      attachments: attachments,
      contentStreamGenerator: _chat!.sendMessageStream,
    );

    yield* response.map((chunk) {
      llmMessage.append(chunk);
      return chunk;
    });

    notifyListeners();
  }

  Stream<String> _generateStream({
    required String prompt,
    required Iterable<Attachment> attachments,
    required Stream<GenerateContentResponse> Function(Content)
        contentStreamGenerator,
  }) async* {
    final content = Content('user', [
      TextPart(prompt),
      ...attachments.map(_partFrom),
    ]);

    final response = contentStreamGenerator(content);
    yield* response
        .map((chunk) => chunk.text)
        .where((text) => text != null)
        .cast<String>();
  }

  @override
  Iterable<ChatMessage> get history => _history;

  @override
  set history(Iterable<ChatMessage> history) {
    _history.clear();
    _history.addAll(history);
    _chat = _startChat(history);
    notifyListeners();
  }
}

Gemini 提供商和Vertex 提供商的实现几乎相同，为您的自定义提供商提供了良好的起点。如果您想查看一个剥离了所有底层 LLM 调用的提供商实现示例，请查看Echo 示例应用，它只是将用户的提示和附件格式化为 Markdown 以作为响应发送回用户。

此页面内容有帮助吗？

感谢你的反馈！

提供详情

感谢你的反馈！请告诉我们如何改进。

提供详情

除非另有说明，本网站上的文档反映了 Flutter 的最新稳定版本。页面最后更新于 2024-12-17。查看源文件或报告问题。