Fork me on GitHub

成都的火锅应该很辣

成都旅游攻略

之前写过两篇关于厦门和长沙旅游的文章,反应还不错。最近把之前的代码重新跑了一遍,很快获取到了两份关于成都美食成都景点的数据,之后进行了数据处理和分析,五一也可以考虑去成都旅游喔。送上厦门和长沙旅游攻略:

海滨城市厦门欢迎你:厦门真的不止鼓浪屿

娱乐之都星城长沙欢迎你:长沙31块的臭豆腐香不香?

数据获取

数据的获取参考之前的文章:

  • 成都景点参考厦门的文章
  • 成都美食参考长沙的文章

涉及到的主要爬虫知识点:

  1. requests发送获取网页数据
  2. 基于正则表达式的数据解析
  3. 基于csv包的数据保存

成都景点

总共8个字段信息:中文名、英文名、攻略数、评论数、位置、排名、驴友占比、简介

成都美食

6个字段信息:中文名、得分、均价、地址、推荐菜、评价

成都景点

数据中主要包含的是成都市区及管辖分区域的景点。

成都景点分布

首先我们看看成都相关的景点都分布在哪些地方?

1
2
3
data = pd.read_csv("成都景点.csv")
location = data["location"].value_counts().reset_index().rename(columns={"index":"location","location":"number"})
location
1
2
3
4
5
6
7
8
9
10
11
c = (
Bar(init_opts=opts.InitOpts(theme=ThemeType.LIGHT))
.add_xaxis(location["location"].tolist())
.add_yaxis("成都市景点数量分布",location["number"].tolist())
.set_global_opts(
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-30)), # 设置旋转角度
title_opts=opts.TitleOpts(title="成都景点分布", subtitle="市区/管辖市"), # 主标题和副标题
)
)

c.render_notebook()

果然大部分的景区还是在成都市区,另外都江堰也是成都的人们旅游景点分布点。

成都广场

成都广场很多的,数据显示竟然达到了189个!!!

可以看下具体的广场数量分布:

1
2
3
4
5
6
7
8
c = (
Pie(init_opts=opts.InitOpts(theme=ThemeType.DARK))
.add("", [list(z) for z in zip(square_location["location"],square_location["number"])])
.set_global_opts(title_opts=opts.TitleOpts(title="成都市广场数量对比"))
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
)

c.render_notebook()

根据广场的攻略数strategy和评论数comment进行降序排列,我们发现几个广场最为突出:

  • 天府广场:成都的中心广场、地标和象征
  • 耍都文化广场:成都有名的集娱乐、美食、休闲于一体的地方
  • 中山广场:是不是每个城市都有自己的中山广场?😑

啤酒广场

在成都适合吃火锅,喝啤酒吧?看下啤酒广场多达45个:

啤酒广场集合咯:金星啤酒广场、野人谷啤酒广场、加勒比啤酒广场、一路香啤酒广场……

啤酒广场的数量分布:

成都的山

西南地区山还是挺多,看下成都的山:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
c = (
Funnel(init_opts=opts.InitOpts(width="1000px",
height="600px"))
.add("成都山景分布",data_pair=[list(z) for z in zip(mountain_location["location"].tolist(),
mountain_location["number"].tolist())])
.set_global_opts(title_opts=opts.TitleOpts(title="成都山景分布",
subtitle="市区/管辖市"),
legend_opts=opts.LegendOpts(type_="scroll", # 图例较多的是实现翻滚
pos_left="92%",
orient="vertical"))
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")) # 添加数据部分
)

c.render_notebook()

到底哪些景点热门?

通过景点的评论数和攻略数的散点分布,我们发掘哪些景点比较热门,我们选取评论数和攻略数都大于100的景点

1
2
3
4
5
6
7
8
## 选择同时存在评论数和攻略数的景点

comment_strategy = data[(data["comment"] > 100) & (data["strategy"] > 100)]
fig = px.scatter(comment_strategy, x="comment",y="strategy",color="comment",text="cn_title")

fig.update_traces(textposition="top center")

fig.show()

通过景点的散点图分布,我们发现了成都的几个热门景点:

  1. 锦里古街
  2. 成都大熊猫繁育研究基地
  3. 武侯祠
  4. 都江堰景区
  5. 人民公园
  6. 文殊院

在上面图形的左下角,也有很多景点算作热门吧??比如:

  • 四川大学
  • 大慈寺
  • 东郊记忆
  • 九眼桥

成都景点之最

我们看看成都的景点之最:

1
chengdu_most = chengdu[(chengdu["abstract"].str.contains("最")) | (chengdu["abstract"].str.contains("唯一"))]
  • 想看大熊猫去:成都大熊猫繁育研究基地
  • 想看老成都的繁华街市:锦里古街
  • 想看成都的现代化商业街区:春熙路
  • 如果你是文艺青年:东郊记忆
  • 如果你是个收藏家:四川博物院,拜访张大千大师的佳作
  • 如果你喜欢道教文化:青羊宫,成都最老的道观

成都美食

高分美食店

1
2
3
# 没有评分(--)用0代替
meishi["得分"] = meishi["得分"].apply(lambda x: x.replace("--","0.0"))
score = meishi.sort_values("得分",ascending=False)[:10] # 选择出得分最高的10个店

1
2
3
4
5
fig = px.bar(score,x="中文名",y="均价",color="均价",text="均价")

fig.update_traces(textposition="outside")

fig.show()

在这些高评分的店中,有小吃店、酒吧、糕点、兔头店

火锅之都

到了成都一定得吃火锅吧???数据显示我们获取到的有213家火锅店,相信肯定是不止这个数。

看看哪些火锅店的评分较高?

通过得分和均价来看看火锅店的分布;

1
px.scatter(guo,x="得分",y="均价",color="得分",hover_name="中文名",size="均价")

整体的火锅店均价都是在90-120之间,毕竟火锅店多!!!

兔头也要吃

除了吃火锅,到了成都兔头你也要尝尝,看下兔头店:

1
2
tutou = meishi[meishi["中文名"].str.contains("兔头")].reset_index(drop=True)
tutou

数据显示刚好10家,最为出名的就是这家店,请你一定要记住:

双流老妈兔头

双流老妈兔头

双流老妈兔头

美食之最

看看游客们对成都的美食都有哪些“最”评价?

1
2
comment_most = meishi[meishi["评价"].str.contains("最")].reset_index(drop=True)
comment_most.head(10)
  • 最好吃的夫妻肺片:夫妻肺片(武侯祠大街店)
  • 最有名的兔头:双流老妈兔头
  • 最佳休闲场所:九眼桥慢摇酒吧
  • 最经典的一道川菜凉菜:成都川菜博物馆(餐馆就好)

推荐菜词云图

都说食在广州,吃在成都,就看看大家推荐了哪些成都美食:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
meishi = pd.read_csv("成都美食.csv")

recommend = meishi[meishi["推荐菜"] != "无"]["推荐菜"].tolist()

rec_jieba_list = []

for i in range(len(recommend)):
# jieba分词
seg_list = jieba.cut(str(recommend[i]).strip(), cut_all=False)
for each in list(seg_list):
rec_jieba_list.append(each)

rec_result = pd.value_counts(rec_jieba_list)[1::].to_frame().reset_index().rename(columns={"index":"词语",0:"次数"})

rec_words = [tuple(z) for z in zip(rec_result["词语"].tolist(), rec_result["次数"].tolist())]

c = (
WordCloud()
.add("", rec_words, word_size_range=[20, 80], shape=SymbolType.DIAMOND)
.set_global_opts(title_opts=opts.TitleOpts(title="成都美食推荐菜词云"))
)

c.render_notebook()

我们选取前50个名次,看看大家主要推荐的美食:

1
2
3
4
5
6
7
8
9
10
11
12
13
from pyecharts import options as opts
from pyecharts.charts import WordCloud
from pyecharts.globals import SymbolType

# 取前50个分词

c = (
WordCloud()
.add("", rec_words[:50], word_size_range=[20, 100], shape=SymbolType.DIAMOND) # 取出前50个
.set_global_opts(title_opts=opts.TitleOpts(title="WordCloud-shape-diamond"))
)

c.render_notebook()

发现果然是个美食之都:牛肉、排骨、抄手、烤肉、毛肚、豆花、黄喉、肥肠😍都是火锅好料

总结

本文中结合两份数据对成都的部分景点和美食进行了分析,发现了成都很多好玩的景点和好吃的美食,希望对想去成都旅游的朋友有所帮助。

有时间我也去成都逛逛😃

一切看似逝去的,都不曾离开,你所给与的爱与温暖,让我执着地守护着这里。

尤而小屋,一个温馨的小屋。小屋主人,一手代码谋求生存,一手掌勺享受生活,欢迎你的光临😃

本文标题:成都的火锅应该很辣

发布时间:2021年04月01日 - 23:04

原始链接:http://www.renpeter.cn/2021/04/01/%E6%88%90%E9%83%BD%E7%9A%84%E7%81%AB%E9%94%85%E5%BA%94%E8%AF%A5%E5%BE%88%E8%BE%A3.html

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

Coffee or Tea