• 简中
    • 繁中
  • 注册
  • 查看作者
  • 酒店用机器学习,预测边啲客人会放鸽子

    转载:本文来自微信公众号“HyperAI超神经”(ID:HyperAI),作者:神经小兮,转载经授权发布。

    内容提要:

    而家,大数据已经被各行各业所应用,酒店行业都不例外。充分利用大数据,使得酒店能够预测市场需求变化,进行智能化决策分析,改善经营状况。

    而家, 各大 OTA(Online Travel Agency)平台极大地方便‌人嘅出行,酒店住宿、景点门票等,剩系要要动郁手指就可以轻松完成预订。

    酒店用机器学习,预测边啲客人会放鸽子

    国内外酒店民宿预订平台,多达数十种

    为‌吸引更多用户预订,呢啲平台会鼓励商家设定较为宽松嘅取消预订政策,比如可随时免费取消,或限时免费取消等。

    全球客房销售量最大嘅网上酒店预订网站 Booking(缤客网),就凭借可免费取消嘅优势,深受广大驴友喜爱。

    不过,对于用户嚟讲,「免费取消」非常 nice,但对酒店嚟讲,就好头大嘎啦。订单临时被取消,通常会畀酒店带来以下损失:

    • 被取消房间无办法及时出售,酒店损失收入;

    • 酒店降低价格出售被取消房间,减少‌利润

    • 为‌尽快订出呢啲房间,酒店需要增加额外嘅宣传、分销渠道嘅费用;

    在用户可以随时放酒店鸽子嘅情况下,酒店有没有乜嘢办法,尽可能减少损失呢?

    一位葡萄牙业务分析师(Business Analyst,简称 BA,呢一职位相当于 IT 公司嘅产品经理) Manuel Banza,有超过 5 年嘅酒店管理从业经验。佢利用公开嘅欧洲酒店预订平台数据,发现‌更容易取消订单嘅用户特点,以帮助酒店及时进行止损。

     从近 12 万条酒店预订数据度,发现规律

    作为一个数据科学爱好者,Manuel Banza 从数据科学和机器学习入手。

    佢首先对一个「酒店预订需求数据集」(Hotel booking demand)进行‌全面分析。该数据集包含‌普通酒店和度假酒店共 32 个维度嘅数据,具体包括:

    用户国籍、预订时间、住宿时间、成人和儿童或婴儿嘅数量、订单最终系咪取消、用户在呢次订单之前共取消订单次数等信息。

    Hotel Booking Demand 

    酒店预订需求数据集

    发布机构:葡萄牙里斯本大学

    包含数量:共 119390 条数据,32 个维度

    数据格式:csv

    数据大小:16.9 MB(压缩文件 1.3 MB)

    地址:https://hyper.ai/datasets/14866

    酒店用机器学习,预测边啲客人会放鸽子

    部分数据展示

    通过统计,Manuel Banza 发现一年时间里,取消酒店订单嘅用户真不少。

    2018 年 OTA 平台 Booking 上嘅预订订单度,有 49.8% 嘅用户取消‌订单;在 HRS Group 上,呢一比例甚至高达 66%。整体来睇,多家平台在 2018 年平均预订订单取消率达到 39.6%。

    酒店用机器学习,预测边啲客人会放鸽子

    各类预订渠道被取消嘅订单比例

    接住,作者对数据进行‌探索性分析,有以下几个发现:

    • 普通酒店和度假酒店相比,订单更容易被客人取消;

    • 春节和夏季嘅取消比例更大,而冬季嘅取消比例最低;

    • 各种预订渠道度,用户在 OTA 平台下单最多,同时 OTA 平台上被取消订单嘅都最多;

    • 用户预订时间越早,不确定性越大,取消嘅概率越大

    作者表示,预订时间是分析酒店收益表现时,最重要嘅指标之一。分析结果表明,提前 1 年以上预订嘅取消概率最高,为 57.14%;一周内预订取消概率最低,为 7.73%。

    酒店用机器学习,预测边啲客人会放鸽子

    预订提前嘅天数(横轴)同取消订单概率(纵轴)成正比

    睇来,计划越早越赶不上变化啊

     机器学习模型:预测谁最可能「放鸽子」

    对数据集进行全面分析后,作者开始建立预测订单取消嘅模型。

    第一步:数据清洗

    首先,对数据集中缺失嘅值进行处理。如果该变量是数字变量,则必须用该特征嘅均值替换呢啲缺失值;如果该变量是分类特征,则必须用常数替换。

    然后删除 reservation_status(预订状态,该变量代表订单系咪被取消,0 为未取消,1 为取消),因为这是机器学习模型将要预测嘅值。

    第二步:选择最佳模型

    在开始为数据测试最佳算法之前,将数据集按 8:2 嘅比例分开。之后将用 80% 嘅数据来训练模型,并将 20% 嘅数据作为验证集。

    在数据科学领域,预测订单取消是一个监督分类问题,都叫做二元分类。因此,作者选取‌几个现有嘅二分类模型如 LightGBM,CatBoost、XGBoost 及 H2O 等,进行训练及对比,最终选出‌实验结果最佳嘅模型 CatBoost。

    通过 CatBoost 预测结果,发现以下几点:

    • 如果用户嘅国籍是葡萄牙,则取消订单嘅可能性好高。不过,对于团体订票嚟讲,酒店一般唔会事先得到每个人嘅国籍信息。如果订单被取消,大多数酒店都会将其国籍默认为酒店所在嘅国家。所以,这项信息只作为参考,并唔一定准确;

    • 同至少提出一个特殊要求嘅用户相比,未提出任何特殊要求嘅用户,取消订单嘅可能性更高;

    • lead_time(预订时间同入驻时间间隔天数)值越低,预订被取消嘅可能性就越低(呢一点预测结果同之前数据分析结果相一致)。

    酒店用机器学习,预测边啲客人会放鸽子

    葡萄牙人气酒店欧洲之星博物馆,店内以考古展览为特色

    上线多个 OTA 平台,支持在线预订及免费取消

    CatBoost 模型在验证集上嘅表现:

    酒店用机器学习,预测边啲客人会放鸽子

    在成个「酒店预订需求」数据集上嘅表现:

    酒店用机器学习,预测边啲客人会放鸽子

     酒店:在取消之前,让我先抢救一波

    使用呢一预测模型,酒店就可以提前获知边啲用户可能取消订单,及时采取补救措施。

    比如,提前联系取消可能性较大嘅用户,通过沟通,让佢们尽可能更早地取消,畀酒店预留更多嘅时间出售房间。

    或者,都可以同有取消倾向嘅用户联系,向佢介绍酒店嘅优点,畀出一啲入住奖励,力挽狂澜挽留佢们。

    机器学习,帮酒店先落手为强

    新闻来源:

    链接

    cantonese.live 足跡 粵字翻譯

    2021-03-30 16:35:10

  • 0
  • 0
  • 0
  • 167
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: