这套算法的基本逻辑就是:根据相似电影的票房规律预测新电影的票房,相似电影的选取会有若干条件(如类型、评分、所处档期、票房体量、近期走势等),然后基于这些相似电影,构建预测天级票房或总票房的机器学习模型。
以预测《哪吒》票房为例,猫眼在前期参考其类型、评分因素,以《大圣归来》为参考影片,后期《哪吒》的票房走势出来后,猫眼发现他与《战狼2》的走势相像,参考《战狼2》的走势调整接下来的票房预测。在《哪吒》上映期间,根据多部上映影片的表现情况实时调整其预测票房。
在国外,谷歌也有一套自己的算法预测模型。谷歌的算法模型主要利用搜索、广告点击数据以及院线排片来预测票房。2013年,谷歌就宣布其模型预测票房与真实票房的吻合程度达到了94%。
与此同时,谷歌通过分析自身的数据还发现,在上映前四周时,大部分电影的预告片都是这个时间发布并开始密集的投放广告,因此,这个阶段的用户搜索信息与票房的相关性会更加紧密。
DataHunter也提到了算法大数据预测票房的难点所在:很多大数据分析工具并不考虑因果性,只考虑相关性,经常会带来“虚假相关”的问题,也就是无法对于数据变化的真正原因进行归因。在大多数场景下,这样的预测并没有什么问题,但是在特定的场景下,偏离预测的情况仍有可能会发生。
此外不成熟的市场环境,以及潜在的风险因素,也会对票房预测产生关键影响。比如影片档期选择、宣发策略的一招失误,就可能导致整个影片的票房成几倍的误差。而某个关键演员的负面新闻也同样会带来不可预期的影响,例如某位主演丑闻,导致《情圣2》撤档。