喊了一整年的预制菜,在年关岁尾之时即将火上“巅峰”——近期,各路食品商家纷纷推出预制菜系列年夜饭。根据媒体报道,目前在上海等地区,很多传统堂食已订购一空,预制菜年夜饭正进入旺销期。
预制菜已经持续风靡许久,众多企业前仆后继、参与其中。群雄逐鹿、烽烟四起!究竟有多少企业挤进了这条餐饮界的“黄金赛道”?
据天眼查信息显示,截至目前,2022年新增注册企业1690余家,同期新增企业注册增速达到了42.7%。这里我们可以以获取天眼查上关于预制菜注册企业信息为项目需求,用python实现一个简单的小爬虫,可以把“预制菜”作为关键字,向天眼查发起请求,得到返回的页面,然后清洗网页,得到数据,存储在本地。 通过爬虫程序+爬虫代理进行大数据采集,其中爬虫脚本使用Python常用的requests+BeautifulSoup+selenium完成。由亿牛云提供隧道转发技术的产品,这种代理产品自带IP池随机切换,直接配置代理信息即可使用方便快捷,参考对方提供的demo完全自动化使用简单粗暴的方式逐页爬行,示例只做了简单的反爬,配置了一下headers参数,修改cookie参数即可使用,实现代码如下:
#! -*- encoding:utf-8 -*-
import requests
import random
# 要访问的目标页面
targetUrl = "http://httpbin.org/ip"
# 要访问的目标HTTPS页面
# targetUrl = "https://httpbin.org/ip"
# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}
# 设置 http和https访问都是用HTTP代理
proxies = {
"http" : proxyMeta,
"https" : proxyMeta,
}
# 设置IP切换头
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text
从从天眼查数据上看,成立于5年内的企业占比47.3%,成立于10年以上的占比为19.6%。这也意味着,近些年有更多的企业正在“抢滩”预制菜的新风口。
参与评论