🤖使用模型资产交换和数据资产交换

type
status
date
slug
summary
tags
category
icon
password
notion image

开始使用模型资产交换和数据资产交换

在本实验中,您将探索 IBM Developer 平台上的两个开源数据科学资源:Model Asset Exchange (MAX) 和 Data Asset Exchange (DAX)。

练习 1 的目标:

  • 在 IBM Developer 上查找开放数据集
  • 探索这些数据集

练习 2 的目标:

  • 在 Model Asset Exchange 上查找即用型深度学习模型
  • 探索用于图像物体检测的深度学习模型
本实验仅需一个网页浏览器,大约需要 15 分钟完成。

练习 1:探索深度学习数据集

Data Asset Exchange 是一个精选的开放数据集集合,来自 IBM Research 和第三方,您可以用这些数据集训练模型。
  1. 在网页浏览器中访问 https://developer.ibm.com/exchanges/data/。这是 IBM Data Asset eXchange (DAX) 主页,一个供开发人员和数据科学家获取免费开放数据集的在线平台。这些数据集可用于训练各类模型,包括文档布局分析、自然语言处理 (NLP) 和时间序列分析等。
    1. notion image
  1. 在本活动中,您将探索 NOAA 天气数据集
  1. 访问 NOAA 天气数据集(https://developer.ibm.com/exchanges/data/all/jfk-weather-data/)。该数据集包含纽约肯尼迪机场气象站八年的天气数据,采用数据科学友好的 CDLA-Sharing 许可(https://cdla.io/)发布。这些时间序列数据可用于预测天气趋势,并已用于训练 MAX 平台上的天气预报模型(https://developer.ibm.com/exchanges/models/all/max-weather-forecaster/)。
    1. notion image
  1. 查看数据集的元数据。数据集以表格形式存储为 CSV(逗号分隔值)文件,这是一种常用的基础数据交换格式。您可以通过 Get this dataset 链接下载数据集。数据以压缩归档形式存储,可使用任何支持 targz 格式的工具解压。
  1. 大多数数据集都附带 Python notebook,可用于数据探索、预处理和分析。这些 notebook 托管在 IBM 的数据科学平台 Watson Studio 上。在课程后续部分,您将深入了解 Watson Studio notebook,包括如何注册和运行。
  1. 现在,您可以点击 Preview the data & notebook(如下图所示)来预览数据集和 notebook。
    1. notion image
      系统将显示数据集元数据、示例记录和词汇表,如下图所示。
      notion image
      在顶部点击 Notebook Preview 选项,您可以查看此数据集附带的 notebook。探索这个 notebook 中的步骤,了解如何在进行数据分析前对数据进行清理。
      notion image
这就结束了本实验的练习 1,该练习介绍了 Data Asset Exchange。现在让我们继续练习 2。

练习 2 - 探索深度学习模型

Model Asset Exchange 是一个精选的开源深度学习模型库,涵盖文本、图像、音频和视频处理等多个领域。
该平台提供两类模型:可部署模型(可在 Docker 或 Kubernetes 上以微服务形式运行)和可训练模型(可使用自定义数据进行训练)。部分模型已预先构建完成,可供测试使用。
在本练习中,我们将探索 CodePen 平台上的物体检测器模型。该模型能够识别图像中的物体,它由深度卷积网络(用于特征提取)和专用于物体检测的附加卷积层组成。模型在 COCO 数据集上训练,可以接收图像输入并输出已标记的检测结果。
CodePen是一个社交开发环境,允许用户在浏览器中编写代码并实时查看结果。这个在线代码编辑器适合各个水平的开发者使用,尤其适合编程学习者。
  1. 访问 CodePen 网页。
  1. 选择 MAX TFJS models。其中的图像分割器能够将图像分割成不同的区域,每个区域对应特定的物体或物体部分。系统会为图像中的每个像素分配一个类别。
    1. notion image
  1. 点击 Select Image 上传图片。您可以选择包含人物、狗、猫、卡车、汽车等物体的图片——这些都是模型已训练过的目标。
    1. notion image
      点击此处查看模型所训练的所有标签
      1. 自行车
      1. 汽车
      1. 摩托车
      1. 飞机
      1. 公共汽车
      1. 火车
      1. 卡车
      1. 红绿灯
      1. 消防栓
      1. 停车标志
      1. 停车计时器
      1. 长凳
      1. 大象
      1. 斑马
      1. 长颈鹿
      1. 背包
      1. 雨伞
      1. 手提包
      1. 领带
      1. 行李箱
      1. 飞盘
      1. 滑雪板
      1. 单板滑雪板
      1. 运动球
      1. 风筝
      1. 棒球棒
      1. 棒球手套
      1. 滑板
      1. 冲浪板
      1. 网球拍
      1. 瓶子
      1. 红酒杯
      1. 杯子
      1. 叉子
      1. 勺子
      1. 香蕉
      1. 苹果
      1. 三明治
      1. 橙子
      1. 西兰花
      1. 胡萝卜
      1. 热狗
      1. 比萨
      1. 甜甜圈
      1. 蛋糕
      1. 椅子
      1. 沙发
      1. 盆栽
      1. 餐桌
      1. 马桶
      1. 电视
      1. 笔记本电脑
      1. 鼠标
      1. 遥控器
      1. 键盘
      1. 手机
      1. 微波炉
      1. 烤箱
      1. 面包机
      1. 水槽
      1. 冰箱
      1. 时钟
      1. 花瓶
      1. 剪刀
      1. 泰迪熊
      1. 吹风机
      1. 牙刷
  1. 点击 Extract prediction 图标:
    1. notion image
      系统将显示您上传图像的预测结果。
      notion image
      例如,对于狗的图片,系统会将背景和狗分别识别出来,显示为两个独立部分。
      您还可以启用网络摄像头选项,实时查看预测结果。
这就完成了练习 2,让您了解了 Model Asset Exchange (MAX) 的基本功能。

作者:Joseph Santarcangelo
其他贡献者:Lavanya
 
上一篇
机器学习模型:从模型中学习以做出预测
下一篇
Adolf Beck 对大脑自发性节律的发现
Loading...