- 设计深度学习系统
- (美)王迟 (美)司徒杰鹏
- 981字
- 2025-03-13 16:30:25
1.2.3 关键用户场景
为了更好地理解深度学习系统在开发周期(图1.1)中的使用方式,我们准备了一些示例场景来说明它们的应用方式。让我们从图1.4中的程序化用户开始。将数据推送到系统的数据收集器通常会通过API最终到达数据管理服务,该服务收集和组织用于模型训练的原始数据。

图1.4 从数据源或收集器推送的数据通过API传递到数据管理服务,在该服务中进一步组织数据,并以更适合模型训练的格式存储数据
深度学习应用程序通常会访问模型推理服务,以从已训练的模型获取推理结果,强化最终用户使用的深度学习功能。图1.5显示了这种交互的顺序。脚本,甚至完整的管理服务也可以是程序化的用户。由于它们是可选的,为简单起见,我们在图中省略了它们。

图1.5 深度学习应用程序通过API请求推理。模型推理服务接受并处理这些请求,根据已训练的模型产生推理结果,然后将推理结果返回给应用程序
在人类用户和API之间通常还有额外一层——用户界面。这个界面可以是基于Web的,也可以是基于命令行的。一些高级用户甚至可能跳过这个界面,直接使用API。让我们逐一介绍每个角色。
图1.6展示了研究人员使用系统的典型场景。研究人员可以查找可用的数据来尝试他们的新建模技术。他们访问用户界面并进入数据探索和可视化部分,该部分从数据管理服务中获取数据。将数据调整为可以被新的训练技术使用的形式可能会涉及大量的手动数据处理。一旦研究人员确定了一种技术,就可以将其打包成库供他人使用。
数据科学家和工程师可以通过查看可用数据来开展用例,类似于前文研究人员最初的做法。数据管理服务将对此提供支持。工作人员提出假设,并将数据处理和训练技术组合成代码。这些步骤可以结合在一起,形成使用工作流管理服务的工作流。
当工作流管理服务运行工作流时,它会与数据管理服务和模型训练服务联系,执行实际任务并跟踪其进度。超参数、代码版本、模型训练指标和测试结果将由各个服务和训练代码存储到元数据和工件存储。
通过用户界面,数据科学家和工程师可以比较实验运行并推断出训练模型的最佳方法。上述场景如图1.7所示。

图1.6 一个研究人员的使用过程,他需要查找可用于研究和开发新的建模技术的数据。该研究人员通过由API和后台数据管理支持的用户界面进行交互

图1.7 数据科学家定义模型训练工作流、运行工作流并审查结果的使用过程
产品经理也可以通过用户界面查看和查询整个系统中的各种度量指标。这些度量指标数据可以由元数据和工件存储提供。