收藏 分享(赏)

基于rosetta的粗糙集理论在糕点食品安全风险监测中的应用.doc

上传人:无敌 文档编号:173385 上传时间:2018-03-23 格式:DOC 页数:8 大小:94.50KB
下载 相关 举报
基于rosetta的粗糙集理论在糕点食品安全风险监测中的应用.doc_第1页
第1页 / 共8页
基于rosetta的粗糙集理论在糕点食品安全风险监测中的应用.doc_第2页
第2页 / 共8页
基于rosetta的粗糙集理论在糕点食品安全风险监测中的应用.doc_第3页
第3页 / 共8页
基于rosetta的粗糙集理论在糕点食品安全风险监测中的应用.doc_第4页
第4页 / 共8页
基于rosetta的粗糙集理论在糕点食品安全风险监测中的应用.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、基于 Rosetta 的粗糙集理论在糕点食品安全风险监测中的应用 张明 刘宏生 辽宁大学生命科学院 沈阳辉山经济技术开发区管委会 摘 要: 目的 以沈阳市 20122015 年糕点食品标准指标监测数据为研究对象, 应用Rosetta 粗糙集理论进行指标约简, 挖掘各指标属性重要性, 从而提出更加科学的指标风险监测方案。方法 对数据合并分类整理, 建立指数分级标准并离散数据生成决策表, 使用遗传算法对数据进行约简。结果 获得 2 组数据约简结果, 确定核心指标为硫酸铝钾、糖精钠、山梨酸、柠檬黄、胭脂红、菌落总数、大肠菌群和霉菌计数。通过筛选得到 18 组指标决策规则, 经分析硫酸铝钾和菌落总数为

2、关键指标。在 2 组约简的不合格规则中, 硫酸铝钾的覆盖度之和均为0.23, 菌落总数分别为 0.38 和 0.36, 并且指数等级值均达到 6 级和 7 级, 提示存在高风险。结论影响糕点食品质量安全的重要指标为硫酸铝钾、糖精钠、山梨酸、柠檬黄、胭脂红、菌落总数、大肠菌群和霉菌计数, 建议至少 1 年监测 2 次, 其中硫酸铝钾和菌落总数为关键监测指标, 应给予高度重视, 至少 1年监测 3 次。其余指标影响较小, 建议 1 年监测 1 次。关键词: 粗糙集; 糕点; 食品安全标准; 指标; 约简; 作者简介:刘宏生, 教授, 博士生导师, 主要研究方向为生物卫生统计学。E-mail:作者简

3、介:张明, 博士研究生, 高级工程师, 主要研究方向为食品质量与安全。E-mail:基金:辽宁省教育厅高等学校创新团队项目 (LT2015011) Application of rough set theory on pastry food safety risk monitoring based on RosettaZHANG Ming LIU Hong-Sheng School of Life Science, Liaoning University; Abstract: Objective To reduce pastry food standard testing data in Sh

4、enyang city from 2012 to 2015 by rough set theory, in order to mine the more important indexes and obtain scientific risk monitoring program. Methods The testing data were obtained and collated, the index classification standard was established, the discrete data decision table was generated, and th

5、e data were reduced by genetic algorithm. Results The core indicators that were obtained from the 2 sets of data reduction results were aluminium potassium sulfate, sodium saccharin, sorbic acid, lemon yellow, carmine cochineal, aerobic plate count, coliforms and moulds. Aluminium potassium sulfate

6、and aerobic plate count were the key indexes by analyzing the rules of 18 sets. The coverage values of aluminium potassium sulfate were 0.23, and aerobic plate count were 0.38 and 0.36, respectively, in the substandard rule of the 2 reduction results. They indicated high risk because of the index gr

7、ades all reached level 6 and 7. Conclusion The important indexes affecting the quality and safety of pastry food are aluminium potassium sulfate, sodium saccharin, sorbic acid, lemon yellow, carmine cochineal, aerobic plate count, coliforms and moulds, and they are recommended to be monitored 2 time

8、s every year at least. Aluminium potassium sulfate and aerobic plate count are the key of the important indexes, which must be monitored 3 times every year at least. The others which are not important should be monitored annually.Keyword: rough set; pastry; food safety standard; index; reduction; 1

9、引言在我国食品安全检验标准框架内, 各类实验室每年都能提供大量食品安全相关监测数据, 如何科学合理利用这些数据来确定重点监测指标已经成为食品安全工作的重点之一1。粗糙集理论可在保证对象分类能力不变的基础上, 消除重复、冗余的属性和属性值, 实现对知识的压缩和再提炼。目前该理论已经广泛应用到医学、化学、材料学、地理学、管理科学和金融学等众多领域2。近年来, 该理论也开始应用到食品安全数据统计分析工作中, 李为相等3使用粗糙集理论评价了某省食品监测指标, 验证了理论方法的适用性。本研究以沈阳市20122015 年糕点食品监测数据为研究对象, 利用粗糙集理论对监测数据指标进行约简, 为科学监测糕点食

10、品安全指标及提高监管效率提供科学依据。2 粗糙集理论粗糙集理论是一种新的处理模糊和不确定性知识的数学工具, 它不需要任何先验信息即可对大量数据进行分析处理, 在保持分类能力不变的前提下, 通过知识约简, 导出问题的决策和分离规则4,5。2.1 知识表达系统知识表达系统也称为信息系统, 它的数据以关系表的形式表示, 关系表的行对应要研究的对象, 列对应对象的属性, 信息是通过指定对象的各属性值来表达。一个信息系统 S 可以表示为一个四元组 S=U, R, V, f, 其中 U 是对象的有限集合, U=x 1, x2, , xn;R 是属性的有限集合, R=r 1, r2, , rn;V 是属性的

11、值域集, V=v 1, v2, , vn, 其中 Vi是属性 Ri的值域;f 是信息函数, f:URV, f (x i, Rj) V j。2.2 知识约简知识约简指在保持知识库分类能力不变的条件下, 删除其中不相关或不重要的知识。核是其中最重要的概念, 它是知识约简时不能消去的知识特征集合, 包含在所有的约简之中。设 U 是对象的有限集合, P 是定义在 U 上的等价关系簇, 如果 IND (PR) =IND (P) , 则称关系 R 在 P 中是不必要的 (多余的) ;否则称 R 在 P 中是必要的, P 中所有必要关系组成的集合称为 P 的核。P 和 Q 为 U 上的两个等价关系簇且 QP

12、, 如果 IND (Q) =IND (P) , Q 是独立的, 则称 Q 是 P的一个约简。2.3 决策表及决策规则2.4 数据标准化和离散化处理质量指数 (I) 是用无量纲的相对数来表示食品质量安全状况的统计方法, 通过建立质量指数分级标准将所有数据进行标准化和离散化处理。(1) 指数计算公式化学检验指标计算公式6-8:因微生物指标检验结果属 Poisson 分布, 为使统计结果有可比性, 需要对数据进行平方根转换9,10。即:式中 Ic (Ib) 为质量指数;X i为各指标实测值;S i为与 Xi相应的标准值。为了避免因 Xi和 Si相差太大而影响评价, 化学指标将实测值上、下限分别规定为

13、相应标准的 10 倍和 1/10, 微生物指标将实测值上、下限分别规定为相应标准的 100倍和 1/100。为了突出超标情况, 一旦发现检测指标超出限量值, 即对 Iic (Iib) 取加权系数 2, 非超标指标不变。(2) 分级标准本研究以“设定所有样本实测值在最佳值、限量值和最差值占总样本数中不同百分比的理想状态”为参考依据, 计算 Is值划分等级。分为 Is1Is7等级分别用数值 17 表示, 具体情况见表 1。(3) 数据处理规定当检测数据为“0”、“阴性”、“未检出”或小于最低“检测限”时, 规定该指标 Ic (Ib) 值为 0.1, 即最小值, 当检测数据为“阳性”、“检出”或“超

14、出计数”时, 规定该指标 Ic (Ib) 值为 20, 即最大值。当微生物检验方式为多级采样方式时, 检测数据按照平均值处理。3 糕点食品标准指标属性约简实例分析3.1 数据选择及决策表的生成20122015 年沈阳市生产加工监督抽查糕点共有 1347 组数据, 每组数据共有 21个属性值 (检验项目) 。其中, 食品添加剂山梨酸、柠檬黄、日落黄、胭脂红、苋菜红、硫酸铝钾、糖精钠、甜蜜素、安赛蜜、丙酸钙共 10 项;常规理化酸价、过氧化值、总砷、铅、黄曲霉毒素 B1 共 5 项;微生物菌落总数、大肠菌群、霉菌计数、致病菌 (沙门氏菌、志贺氏菌、金黄色葡萄球菌) 共 6 项。各指标参照相关国家标

15、准11,12规定限量值 (见表 2) 分别计算质量指数 I 值, 然后对照分级标准 (表 1) 输入等级值组成条件属性集;不合格产品用“F”表示, 合格产品用“T”表示组成决策属性集, 手动离散数据导入 Rosetta 软件中。3.2 决策表约简采用 Rosetta 软件中的遗传算法进行计算, 求解最小命中集合, 种群直接从属性集 A 的幂集 2 中选择, 利用二值符号串表示个体, 符号串的每一位表示相应的属性是否出现13-15, 算法的适应函数定义如下:由于数据量较大, 数据补齐直接采用移除不完整法, 移除后指标数据为 847 组进行约简, 得到 2 组约简结果, 详见表 3。根据粗糙集理论

16、知识约简定义 (2.2) , 所有 21 个检测项目组成属性集 U, P 为 U 的等价关系簇, 约简后的结果是 P 中所有必要关系组成的集合称为 P 的核, 即 2 组约简指标为所有检测项目的核心指标, 是必要指标, 而其他被约简的指标是不必要的指标, 称为一般指标。综合分析得出硫酸铝钾、糖精钠、山梨酸、柠檬黄、胭脂红、菌落总数、大肠菌群和霉菌计数为核心指标, 其他指标可约简。说明影响糕点食品质量安全的重要指标为硫酸铝钾、糖精钠、山梨酸、柠檬黄、胭脂红、菌落总数、大肠菌群和霉菌计数。其他指标酸价、过氧化值、总砷、铅、黄曲霉毒素 B1、甜蜜素、安赛蜜、日落黄、苋菜红、丙酸钙、致病菌 (沙门氏菌

17、、志贺氏菌、金黄色葡萄球菌) 为一般指标。3.3 决策表规则获取本研究参照我国食品安全产品标准检测结果判定标准, 即所有检测指标全部合格, 产品检测结果判定为合格 (T 表示) , 只要有 1 项或以上不合格, 该产品判定为不合格 (F 表示) , 同时根据质量指数分级标准表 1 中规定, 通过标准化处理将指标单项检测数据转化为质量指数, 合格指标划分为 1、2、3、4 四个等级, 不合格指标划分为 5、6、7 三个等级。由于数据标准化处理采用限量标准指数算法且手动导入离散化数据, 所以粗糙度 值均为 1, 结果 rij均是确定的。约简后得到指标规则 138 项, 设定覆盖度高于 0.05,

18、得到指标规则 18 项, 详见表 4。在规则中可见:19 为第 1 组约简规则, 14 为决策属性为“T”的规则, 覆盖度和为 0.79, 表明 79%的合格结果由这 4 项规则决定, 变化指标为硫酸铝钾等级值为 2 级、菌落总数等级值为 2 级和 3 级, 其余指标等级值均为 1级。59 为决策属性为“F”的规则, 覆盖度和为 0.61, 表明 61%的不合格结果由这 5 项规则决定, 变化指标为硫酸铝钾等级值为 6 级和 7 级, 覆盖度和为0.23, 占 23%。菌落总数等级值为 6 级和 7 级, 覆盖度和为 0.38, 占38%。1018 为第 2 组约简规则, 1013 为决策属性

19、为“T”的规则, 覆盖度和为0.75, 表明 75%的合格结果由这 4 项规则决定, 变化指标为硫酸铝钾等级值为2 级、菌落总数等级值为 2 级和 3 级, 其余指标均为 1 级。1418 为决策属性为“F”的规则, 覆盖度和为 0.59, 表明 59%的不合格结果由这 5 项规则决定, 变化指标为硫酸铝钾等级值为 6 级和 7 级, 覆盖度和为 0.23, 占 23%, 菌落总数等级值为 6 级和 7 级, 覆盖度和为 0.36, 占 36%。由两项约简结果可知, 影响糕点食品质量安全最重要的单项指标为硫酸铝钾和菌落总数, 硫酸铝钾在 2 组规则中不合格平均占比 23%, 菌落总数在 1、2

20、 组规则中不合格平均占比分别为37%, 并且等级值为均达到 6 级、7 级水平, 提示质量安全度存在高风险, 其他指标无变化, 影响相对较小。通过与实际数据5传统不合格率判定方法进行比较, 1347 组数据中不合格产品数为 93 组, 硫酸铝钾指标不合格数为 23 个, 不合格占比 24.7%;菌落总数指标不合格数为 36 个, 不合格占比 38.7%, 硫酸铝钾和菌落总数指标预测准确率分别为 93.12%和 95.61%, 可以看出, 预测精度较高, 产生差异的主要原因为数据补齐过程中的数据丢失所造成。表 1 质量指数分级标准表 Table 1 The classification stan

21、dard of quality indexes 下载原表 表 2 糕点类食品安全标准规定各指标最高允许限量值 Table 2 Maximum permissible limits for each index of food pastry safety 下载原表 表 3 指标约简情况表 Table 3 The reduction results of index 下载原表 表 4 指标约简规则 Table 4 The reduction rule of index 下载原表 表 4 指标约简规则 Table 4 The reduction rule of index 下载原表 4 结论综上所述

22、, 本研究首次将粗糙集理论应用到糕点食品安全指标监测大数据分析中, 结合质量指数法和 Rosetta 软件实现运算过程。结果表明 Rosseta 软件分析预测精度较高, 影响糕点食品质量安全的重要指标为硫酸铝钾、糖精钠、山梨酸、柠檬黄、胭脂红、菌落总数、大肠菌群和霉菌计数, 应给与足够重视, 建议至少 1 年监测 2 次, 其中食品添加剂硫酸铝钾和微生物指标菌落总数为核心关键监测指标, 至少 1 年监测 3 次。而其他指标为一般指标, 影响较小, 建议 1 年监测 1 次。参考文献1肖革新, 肖辉, 刘杨, 等.食品安全大数据分析思考J.中国数字医学, 2014, (9) :1-7.Xiao

23、GX, Xiao H, Liu Y, et al.Thinking about big data analysis of food safetyJ.China Digit Med, 2014, (9) :1-7. 2张文修, 吴伟志, 梁吉业, 等.粗糙集理论与方法M.北京:科学出版社, 2001.Zhang WX, Wu WZ, Liang JY, et al.Theory and method of rough setM.Beijing:Science Press, 2001. 3李为相, 程明, 李帮义, 等.粗集理论在食品安全综合评价中的应用J.食品研究与开发, 2008, (29)

24、:152-156.Li WX, Cheng M, Li BY, et al.Extended dominance rough set theorys application in food safety evaluationJ.Food Res Dev, 2008, (29) :152-156. 4Zdzislaw Pawlak.Rough setsJ.Inter J Comp Inform Sci, 1982, (11) :341-356. 5李靖, 薛凌峰, 武金坤, 等.粗糙集理论在大坝安全监测数据处理中的应用J.三峡大学学报, 2008, (30) :29-32.Li J, Xue L

25、F, Wu JK, et al.Application of rough set theory to processing of dam safety monitoring dataJ.J Three Gorges Univ, 2008, (30) :29-32. 6NY/T 398 农业行业标准农、畜、水产品污染监测技术规范S.NY/T 398 Procedural regulations regarding monitoring of pollutants in the produces of agriculture, animal husbandry and fisheryS. 7孙延斌

26、, 孙婷, 董淑香, 等.污染指数法在乳制品重金属污染评价中的应用研究J.中国食品卫生杂志, 2015, (4) :441-446.Sun YB, Sun T, Dong SX, et al.The application of contamination index method to evaluate heavy metal contaminations in dairy productsJ.Chin J Food Hyg, 2015, (4) :441-446. 8胡桂仙, 王小骊, 董秀金, 等.3 种干食用菌中汞、砷、铅、镉重金属的污染的检测与评估J.浙江农业学报, 2011, (2

27、) :349-352.Hu GX, Wang XL, Dong XJ, et al.Investigation and evaluation on pollution of heavy metals Hg, As, Pb and Cd in three dried edible fungiJ.Acta Agric Zhejiang, 2011, (2) :349-352. 9徐卫东, 谭程宁, 高胜同.试用综合质量指数评价冷饮食品的卫生状况J.中国公共卫生, 1990, (4) :153-154.Xu WD, Tan CN, Gao ST.Used the comprehensive qual

28、ity index to evaluate the ice creamJ.Chin J Public Health, 1990, (4) :153-154. 10魏德江, 梁洪军, 陈必松.用综合质量指数评价我区冷饮食品的卫生状况J.人民军医, 1991, (7) :15-18.Wei DJ, Liang HJ, Chen BS.Used the comprehensive quality index to evaluate the ice cream in our military regionJ.Peoples Military Surgeon, 1991, (7) :15-18. 11G

29、B 7099 糕点、面包卫生标准S.GB 7099 Hygienic standard for pastry and breadS. 12GB 2760-2011 食品安全国家标准食品添加剂使用标准S.GB 2760-2011 National food safety standard-Standard for uses of food additivesS. 13Staal Vinterbo, Aleksanderhrn.Minimal approximate hitting sets and rule templatesJ.Inter J Approx Reas, 2000, (25) :

30、123-143. 14臧红岩.基于 Rosetta 的粗糙集神经网络在风机故障诊断中的应用J.可编程控制器与工厂自动化, 2011, (5) :79-80.Zang HY.Rough set reduction of fan fault diagnosis based on RosettaJ.PLC FA, 2011, (5) :79-80. 15田静宜, 潘宏侠, 杨业, 等.基于粗糙集和神经网络的柴油机故障诊断J.柴油机设计与制造, 2010, (3) :29-35.Tian JY, Pan HX, Yang Y, et al.Diesel engine fault diagnosis based on rough sets and neural networkJ.Des Manu Diesel Eng, 2010, (3) :29-35.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报