1、基于多元分析的任务定价模型 魏秋实 燕山大学信息科学与工程学院 摘 要: 本文针对众包服务的任务定价问题, 运用多元线性回归分析方法建立了相应数学模型。首先绘制了任务的分阶段定价位置图像, 确定任务定价在所给经纬度范围内的分布情况, 从而将整个区域等分为九个小模块。接着, 计算每个模块中的总任务量、总会员数、平均信誉值、平均预订时间差和平均预定任务限额。以上述数据作为解释变量, 利用多元线性回归模型求得模块的平均定价方程。由回归方程得到任务的定价规律, 发现任务未完成的主要原因是定价过低, 其他因素如任务量、总会员数等均是通过影响定价, 从而间接影响任务完成情况。关键词: 任务定价; 多元线性
2、; 回归分析; 顾名思义, 众包就是将一些过去由固定职员所做的工作通过互联网平台发布, 让广大群众根据自身情况自行承包并完成任务的一种分布式问题求解模式1。1 Y=114.157+0.053X-0.01 模型准备站在 APP 任务发布者的角度考虑, 为了使公司利益最大化, 应尽量在任务能被完成的前提下标价最小金额。因此, 只需考虑距离较近的会员所在位置、会员总数量, 会员预定任务限额、会员信誉值等因素。站在任务接受者的角度考虑, 为了使赚取到的金额最大化, 理性的任务接受者不会一味的追求标价最大的任务, 而是在考虑距离成本的前提下选择相对标价较高的任务。因此, 人们不会选择跨区域去完成任务。本
3、文将区域进行了划分, 将其划分为九个区域, 只需计算九个区域所对应的总任务量、平均定价、任务完成度、总会员数、平均预定任务限额、平均信誉值和平均预订时间差。其中:2 定价规律分析对于任务定价, 不仅涉及到任务所处位置, 还涉及到任务发布区域内会员的位置、数量、预订任务限额、信誉值和预订时间等因素的影响。可以看出, 此为多个自变量影响一个因变量的模型。建立多元线性回归方程, 设 Y1为区域平均定价, X 1为区域总任务量, X 2为区域总会员数, X 3为平均信誉值, X 4为平均预订时间差, X 5为平均预订任务限额。利用 SPSS 统计软件求解结果如表 1:表 1 模型汇总 下载原表 上述回
4、归模型调整的 R 方是 0.986, 说明回归的拟合度非常高。D-W 值为 2.468, 说明模型不存在正自相关性2。证明所建模型合理。从该表可以得到线性回归模型, 其形式为:3 模型分析由上述模型计算得总的任务完成率为 62.51%, 平均定价为 69.11。以此为分界线, 本文认为当区域任务完成率高于总任务完成率时, 该区域定价合理, 反之, 则不合理。对于划分的第一个区域, 原因在于编号为 B0007 和 B0022 两个会员的位置与任务整体位置的差异。编号 B0007 会员位置对应到实际情况中为重庆市璧山区, 编号 B0022 会员位置对应到实际情况中为湖南省邵阳市隆回县, 与任务主要
5、分布地广州市和东莞市相距较远, 利用高德地图开放平台得到地理位置如图 1 所示:图 1 B0007 和 B0022 会员位置图 下载原图因为地理位置原因, 这两位会员到区域 1 的距离与他们到其他 8 个区域的距离相差不大, 所以跨区域完成任务使得他们增加的成本并不高。故将其从区域 1数据中剔除。区域 1 任务完成度低的主要原因是总任务量大于总会员数, 即供大于求, 会员由更大的选择空间, 使得接受任务而不去完成的情况增多, 区域 1 平均信誉值也相对较低。对于区域 8 和区域 9, 任务完成率低的主要原因在于区域平均定价低。此时, 就算区域 9 内会员数远大于任务数, 人们也会因为定价较低而
6、放弃接受任务。综合以上分析, 造成任务未完成的原因有很多, 如区域内总任务量、区域平均定价、区域内总会员数、会员平均预订任务限额、会员平均信誉值、会员平均预订时间差等。其中影响最大的因素为区域平均定价。4 结论本文研究项目的定价规律时, 将图形平均分为九个等面积区域, 把问题简化为研究这九个不同区域间的平均项目定价规律, 最终得到拟合优度为 0.986 的回归方程, 说明模型拟合程度较高。本文所建的模型均是建立在真实情况、真实地理位置的基础上, 具有一定的指导性, 便于模型的进一步推广。不仅可以用于“拍照赚钱”的任务定价, 还可以应用于其他众包定价模式中。也可根据不同的问题背景设置不同的参数, 较为方便的解决问题。参考文献1童咏昕, 袁野, 成雨蓉, 陈雷, 王国仁.时空众包数据管理技术研究综述J.软件学报, 2017, 1 (02) :3558. 2赵卫亚.检验的局限性与模型的高阶自相关检验J.统计与决策, 2004, 3 (01) :1819.