实际上,我做的是超级简化版.
题目:
下面每一行是一个购物小票,直到遇到五个零00000,输入序列终止,每个字母表示一种商品(字母区分大小写,即a 和A代表不同的产品),请分析哪两个种产品的销售相关性最高:
样例输入:
AABZXY
BMNY
CD
CBYPQ
BWVCY
00000
输出(字幕顺序按ASC码升序排列):
BY
代码:
1 | from __future__ import print_function |
ps.我忘记加去重了,所以这个代码还有点问题。
以后再改。
小故事:啤酒与尿布
- 故事内容
这个故事发生于20世纪90年代的美国超市中,超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。
- 故事起因
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。
如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。
超市发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物。
- 故事小结
这个故事是因为有数据分析的结果支持才会获得成功并得到广泛传播,通过分析购物篮中的商品集合数据,找出商品之间的关联关系,发现客户的购买行为,从而获得更多的商品销售收入。