您的位置首页>科技>

AI生成的图像无法解决皮肤病学数据库中的多样性问题

导读众所周知,皮肤状况的图像数据库偏向于较浅的皮肤。与其等待收集更多关于深色皮肤上的癌症或炎症等疾病图像的缓慢过程,一个小组希望使用人

众所周知,皮肤状况的图像数据库偏向于较浅的皮肤。与其等待收集更多关于深色皮肤上的癌症或炎症等疾病图像的缓慢过程,一个小组希望使用人工智能来填补空白。它正在开发一个人工智能程序,以生成深色皮肤疾病的合成图像——并将这些图像用作可以帮助诊断皮肤癌的工具。

“拥有深色皮肤的真实图像是最终的解决方案,”加拿大麦克马斯特大学从事该项目的机器学习专家EmanRezk说。“在我们拥有这些数据之前,我们需要找到一种方法来缩小差距。”

但该领域的其他专家担心使用合成图像可能会引入他们自己的问题。斯坦福大学皮肤病学临床学者RoxanaDaneshjou说,重点应该是向现有数据库添加更多不同的真实图像。“创建合成数据听起来比努力创建多样化数据集更容易,”她说。

在皮肤病学中使用AI有很多努力。研究人员构建了可以扫描皮疹和痣图像的工具,以找出最可能的问题类型。然后,皮肤科医生可以使用这些结果来帮助他们做出诊断。但是大多数工具都是建立在图像数据库上的,这些图像数据库要么不包含许多深色皮肤状况的示例,要么没有关于它们所包含的肤色范围的良好信息。这使得团体很难相信工具在深色皮肤上的准确性。

这就是Rezk和团队转向合成图像的原因。该项目有四个主要阶段。该团队已经分析了可用的图像集,以了解较深肤色的代表性不足。它还开发了一个人工智能程序,该程序使用浅色皮肤上的皮肤状况图像来生成深色皮肤上的这些状况的图像,并验证模型提供的图像。“由于人工智能和深度学习的进步,我们能够使用可用的白色扫描图像来生成具有不同肤色的高质量合成图像,”Rezk说。

接下来,该团队将把深色皮肤的合成图像与浅色皮肤的真实图像结合起来,创建一个可以检测皮肤癌的程序。Rezk说,它将不断检查图像数据库,以找到可以添加到未来模型中的任何新的、真实的深色皮肤皮肤状况图片。

该团队并不是第一个创建合成皮肤图像的团队——包括GoogleHealth研究人员在内的一个小组在2019年发表了一篇论文,描述了一种生成它们的方法,它可以创建不同肤色的图像。(谷歌对皮肤病学人工智能很感兴趣,并在去年春天宣布了一种可以识别皮肤状况的工具。)

Rezk说,合成图像只是权宜之计,直到有更多关于深色皮肤状况的真实图片可用。然而,Daneshjou完全担心使用合成图像,即使是作为一种临时解决方案。研究团队必须仔细检查人工智能生成的图像是否有任何人们用肉眼无法看到的常见怪癖。从理论上讲,这种怪癖可能会扭曲AI程序的结果。确认合成图像与模型中的真实图像一样有效的唯一方法是将它们与真实图像进行比较——真实图像供不应求。“然后回到这个事实,好吧,为什么不努力尝试获得更多真实的图像呢?”她说。

Daneshjou说,如果诊断模型基于一组的合成图像和另一组的真实图像——即使是暂时的——这是一个问题。这可能导致模型在不同肤色上的表现不同。

她说,依靠合成数据也可能使人们不太可能推动真实、多样化的图像。“如果你要那样做,你真的会继续做这项工作吗?她说。“我实际上希望看到更多的人致力于获取多样化的真实数据,而不是试图解决这个问题。”

版权声明:本文由用户上传,如有侵权请联系删除!