这家人工智能初创公司希望像亚马逊这样的每家商店都能实现自动化

日期:2018-06-06 浏览:30

去年年底,当亚马逊取笑它的自动便利店时,亚马逊Go的反应从对新技术的迷恋到对AIs继续接管工作场所的屈辱。使用机器学习、照相机和其他传感器,亚马逊可以跟踪人们从货架上拿走的东西,并向他们收取外出时的费用——不需要收银员。尽管亚马逊Go一直被棘手的技术问题所困扰,但它在博德加( Bodega )却步履蹒跚。博德加是一家为方便商品而开设的信息亭,它立即被视为对纽约等城市街角商店机构的生存威胁。

广告现在,旧金山初创公司保利( Poly )进入这一收费环境,该公司是开发相机系统和机器学习模型以跟踪购物者购买情况的几家公司之一。保利为Fast公司提供了这项技术的独家预览,这项技术实质上是亚马逊的零售业务。联合创始人阿尔韦托·里佐利说,该公司已签约一家“大型连锁”零售商进行试点项目。里佐利说,在未来几个月飞行员开始之前,客户不想具名,尽管他提到与7 - Eleven会面。

为了获得灵感,里佐利不仅去硅谷,还去了托斯卡纳海滨,在那里,他在家庭假日期间在海滨酒店业balenare playmanto balenare购物。他说:「我会拿一包爆米花给店员看……她会把它写在一张纸上。」假期结束时,里佐利结清了爆米花和其他他捡到的东西的账单。他说:「天知道我被骗了多少里拉。」“[,但是]那种轻松让我总是依赖那种不用排队的地方。“

不像亚马逊承诺的无人商店(由BingoBox等机构在中国交付),里佐利声称保利将消除单调乏味的工作,但不是全部工作。他说:「如果我们做得对,那么我们可以有一个系统,实际上可以让任何创业的人获得更多与客户互动的能力。」“他们唯一不做的就是结帐部分。“

AI遇到了混乱的现实生活,但是,把它做好是一个巨大的技术挑战。世界上最大的人工智能公司之一亚马逊曾计划在2017年初向公众开放其首家亚马逊Go store,但由于技术故障而被无限期推迟(据华尔街日报报道)。不过,西雅图这个庞然大物及其磨难并没有吓跑竞争对手。总部设在圣克拉拉的标准认知公司最近从包括查尔斯河和Y Combinator在内的投资者那里筹集了500万美元,以实现bootstrapple Poly的目标。里佐利说,他知道至少还有另外一家初创公司的竞争对手,它仍在秘密行动中。

[照片:肖恩·队长]里佐利向我展示了保利租用几张桌子的火箭太空公司合作办公室一家小模拟商店的技术挑战。当我们走进房间时,安装在天花板附近的安全摄像头很容易辨认出我们:也就是说,它辨认出了两个人,并成功地将我们区分开来。里佐利说:「它从我的全身提取信息,并在整个商店使用这些信息,以确保始终是同一个人。」这包括衣服、身体运动和头发颜色等东西——在房间的监视器上可以看到叠加在我们身体上的棒状图形。系统还记录我们的衣服和脸。Rizzoli说,

Poly不必用面部识别来为每张脸贴上真实姓名,尽管这确实让结帐变得容易得多。他的理想(在中国一些自动化商店中应用的一种模式)是让购物者注册该系统,包括相机在顾客进出商店时用来识别顾客的照片,以便自动向他们的账户收费。他们还会使用应用程序登录商店。(例如,在中国的涛咖啡馆,这涉及到扫描手机屏幕上的QR码。)

广告当我指出这可能是多么令人毛骨悚然时,里佐利承认,一些潜在客户也不希望这样的跟踪水平。他提出了一些变通办法。该系统可以提取足够的信息来区分人们,而不必给他们附加真实身份。顾客可以用现金甚至信用卡支付,保利承诺,它不会把信用卡号码与它所看到的相符。

演示包括一台大屏幕电视,显示监控系统的职员会看到什么。我们屏幕上的棒状渲染说明了保利是如何从动作中提取意义的。演示屏幕标记了站立、吃饭、喝酒甚至跳舞等活动,暗示了这项技术的未来用途。

「我们希望这不仅用在货架上的产品上。」oli,“比如有多少人在7 - Eleven使用咖啡机,或者有多少人在使用气泵。“不过,回到我们的小商店,系统主要是在我们两个人伸手去拿货架上的产品时跟踪的。

[照片:肖恩·队长]这些产品不一定要在特定的地点才能被识别。为了准备这个演示,里佐利偷工减料地安装了一个扫描系统——基本上是一个装满灯和照相机的塑料盒。它在不同的角度、光照条件和镜头畸变类型下拍摄成千上万张每种产品的照片,以训练保利如何在任何条件下识别例如可乐罐。我问里佐利,使用可口可乐或通用磨坊等供应商的数码图像,这种自动化程度会更高吗?“有时他们会对物体进行3D扫描。理想的情况是,我们可以使用3D资产,然后进行完全3D生成的过程来训练新产品,”他说。不过,他近期的目标只是买一只能够自动装卸摄影产品的机械臂。

视频源是由Poly从中国制造商订购的廉价相机拍摄的,经过高端图像传感器的修改。每秒15帧1080 p高清视频足以训练和运行所需的多种图像和活动识别模型。将视频发送到云将花费太长时间,因此素材在带有单个高端图形卡( Nvidia 1080 ti,尽管甚至低端卡也可以工作)的PC上本地处理。利佐利声称,这是一种比竞争对手更有优势的效率。

「没有单一的模型可以做所有这些自主的市场工作,所以我们实际上在这里做多种事情。」“这里运行的是不同模式的组合,试图弄清楚你是谁,你在哪里,你在做什么,然后最终弄清楚你在使用什么产品。“保利已经测试了多达23人的系统(最适合他们的小房间),Rizzoli估计它可能能处理多达40人的问题。据报道,亚马逊在追踪20多人时遇到困难。

广告[照片:肖恩船长]保利不必从头开始。该公司是为盲人制造辅助技术的产品,是早期初创企业Aipoly的枢纽。它的免费Android和iOS应用程序(现在仍然可用)可以识别不同种类的物体,比如不同种类的食物、动物(包括狗和猫的品种)、产品和植物,以及个人的肤色甚至面孔,以及骑自行车等体育活动。保利把它的人工智能引擎和型号带到了新的合资企业。

图像和活动跟踪的多层次超出了自助结账的范围。它可以作为商店安全系统、库存跟踪系统以及确保员工不偷懒的方法。保利还制作热图,让顾客深入了解商店的运作方式。而且它收集可能引起营销人员兴趣的信息——比如人们看和/或拿起什么产品来检查,即使他们最终没有购买它们。

自助结账2.0?保利与你想象中的所有挑战抗争。举个例子,背对着相机站着看不清你拿了什么。如果两个人站得很近,也会感到困惑。在一个完整的实施方案中,一家商店将有几个摄像机安装在高处(保利称之为“鹰”)以避开障碍物。当有人到收银台时,几个摄像机在给他们充电之前,需要验证他捡到的物体。里佐利说,跟踪变得更好了,每个架子下面都有一个叫猫头鹰的照相机,可以看到架子下面的一切。这是一项额外的成本,但保利将鼓励客户选择的重要升级。

行动中的猫头鹰摄影机的早期版本。[动画:保利的礼遇]语境也很重要。目标不是能够识别商店所携带的成千上万个物品中的任何一个,不管它们在哪里。举例来说,监视乳品区的摄像机将寻找牛奶、黄油和酸奶等东西,尽管保利可以辨别是否有人从商店的另一个地方放下了一件物品。里佐利说:「所以,我们不想说那是一块波特豪斯牛排,因为那并不总是有效的。」“但我们知道牛奶通道上有一块红肉。“

水果和蔬菜等新鲜食物证明特别棘手,需要大量的模型训练来考虑形状和尺寸的变化,以及物品堆积在一起时的堵塞。识别多种物品,比如一只手里拿着两罐汽水,也是一项重大挑战。

任何自动化市场面临的挑战是,如果它不能100 %发挥作用,它就会发挥作用esnt根本起作用。对目前自助结账系统的失望是一个很好的例子,但是保利正试图做一些更困难的事情。(最成功的自动化市场之一,中国的BingoBox,要求消费者扫描产品上的条形码——这比要求100 %的图像识别容易得多。)

广告据报道,当beta测试人员挤满商店或走得太快时,亚马逊就吸取了教训。里佐利说,一个系统需要准备好处理一系列可能的场景——从人们有条不紊地收拾物品和走动的“文明”场景,到人们撞到物品和物品从货架上掉下来的不文明场景。他说:「以文明的方式,我们就可以取得店里98 %的物品纪录。」“如果你这样做不文明,那可以降到70 %。我们正试图把不文明的情况完全掩盖起来。“