法语维基百科上的医学文章“正确率高”

回顾尼古拉斯•于连

博士论文[1]法国的大学检查了法语维基百科上医学文章的准确性。从英文摘要:“我们选择了5个项目的样本(笔画,结肠癌,糖尿病,接种疫苗和中断妊娠)我们比较,主张,断言,与参考资料来源,以确认或驳斥每个断言。结果:在5篇文章中,我们分析了868个断言。其中,82.49%被引用者验证,15.55%由于缺乏信息而无法验证,1.96%被引用者反驳。在矛盾的结果中,10代表过时的概念,7代表错误,但主要处理流行病学或统计数据,因此在使用时不会导致重大风险,不推荐,对健康。结论:本研究通过对5篇医学文献的研究,发现其正确率高,错误信息少于2%,经科学文献证实的信息超过82%。这些结果有力地证明维基百科可能是一个可靠的医学信息来源,但前提是它不再是人们为此目的使用的唯一来源。”

这篇医学博士论文是对维基百科上发表的医学信息所提出的问题的一个很好的文档分析。虽然研究结果,在摘要中总结,对那些熟悉维基百科的人来说不会是新的,它对有关医学准确性的文献进行了很好的回顾,还有维基百科的目的(不是专业的百科全书,但是一种大众科学,介绍,还有一些链接可以更进一步)。这份文件是法文的。

评估44个维基百科语言版本的文章质量和流行度

回顾尼古拉斯•于连

从论文来看:英语12个主题领域的质量分数分布,德语和法语维基百科

图像Włodzimierz Lewoniewski,Krzysztof W_cel和Witold Abramowicz,CC 4.0

英语的重叠部分,德国和法国维基百科对大学的报道。作者提供了交互式在线工具为其他主题区域和语言组合生成这样的Venn图。
图像Włodzimierz Lewoniewski,Krzysztof W_cel和Witold Abramowicz,CC 4.0

这是杂志上一篇论文的主题信息学[2]。“我们的研究表明,在语言敏感的话题中,在相关的语言版本中,信息的质量可以相对较好。然而,在大多数情况下,维基百科的读者很难确定所描述主题的语言归属。此外,维基百科的每个语言版本在评估内容质量的手册中都有自己的规则。不同语言版本的评分方案也有所不同:有些使用6-8级的评分系统来评估文章,有些限制在2-3个。这使得不同语言之间的文章自动质量比较成为一项具有挑战性的任务,特别是如果我们考虑到大量未分摊的物品;维基百科的一些语言版本有99%以上的文章没有质量等级。本文对44个语言版本的2800多万篇文章进行了相对质量和人气评价。并对热门话题文章的质量和受欢迎程度进行了对比分析。此外,研究了不同语言维基百科选题文章的质量与受欢迎程度之间的关系。这种方法可以让我们找到质量更好的文章,这些文章可以用来自动丰富维基百科的其他语言版本。

关于质量指标,我对语言方面的报道表示敬意,这超越了维基媒体基金会(必威买球必威买球矿石)只有在一些大型语言项目中才有。正如作者解释的那样,这部分主要是基于已经发表的作品,但相当扩展。并对不同语言间的质量比较提出了一些解决方案,并考虑到不同文化之间视角的差异。

它也开启了关于文章受欢迎程度的讨论,以及如何帮助选择文章存在时必须选择哪种主语言。虽然这部分才刚刚开始,他们的讨论使他们的工作进入了下一步。期待。

来自论文:在英语维基百科上按质量等级分布的各种文章指标
图像Włodzimierz Lewoniewski,Krzysztof W_cel和Witold Abramowicz,CC 4.0

维基百科:一个重新思考信息源可信度之间联系的机会,信任,和权威”

回顾FULBERT

这篇理论论文〔3〕探讨了可信度之间的模糊关系,信任,图书馆和信息科学的权威以及它们如何与信息源的感知准确性相关。信誉与信任息息相关,必要时,我们寻求学习或传达信息之间的人。当考虑到来源的权威时,这就复杂了,随着个人或机构专业水平的提高,以更大的可信度发言的能力也会增强。

关于网络上的知识和信息是如何起作用的文献是不一致的,因此,这项工作试图通过一种新的模式来发展一种统一的方法。作为信誉,信任,权威是两个不同的概念经常被不一致地使用在一起,他们通过维基百科是如何被使用和理解的来探索这些问题。维基百科被认为是非常准确的,人们对它的信任一般,但它的可信度有时令人怀疑。

Sahut和Tricot发展了权威,信任与信任(ATC)模型,如果“知识机构授予来源权力,这一权力确保信任,从而确保信息的可信度。“信息的可信度建立信任,它建立了信息源的权威,“这个模型在维基百科中引用信息源时很有用,因为它有助于解释在维基百科中提供引用的做法如何提高可信度,从而鼓励信任,“将内容链接到现有的知识来源和机构。”

ATC模型是解释维基百科的有用框架,拥有庞大的读者群,由于文章引用和引用的不一致,继续遭受被视为权威的挑战。这一理论认为,填补这些空白将增加权威,从而提高维基百科本身的声誉。

图2来自本文,在维基百科上的权威,信任和信誉。(“教育机构可以在维基百科上传播坏名声,削弱了它的权威,对其信任产生负面影响,这对信息的可信度产生了负面影响。相反,积极体验维基百科信息的可信度,增加读者的信任度。”)
Gilles Sahut和Andr_Tricot,公共领域

会议和事件

学术与维基百科:教育与研究的批判观点

一个征稿启事发表于一个名为“学术界和维基百科:教育和研究的关键观点”的会议上,将于6月18日举行,2018,在埃里克西大学在爱尔兰共和国。组织者将其描述为“一个为期一天的会议,旨在调查研究人员和教育工作者如何使用和查询维基百科。”这次会议是一个展示维基百科研究成果的机会;研究维基百科,或者使用维基百科作为数据对象的研究。

Wiki车间2018

第五版Wiki车间将在里昂举行,法国4月24日,2018,作为的一部分2018年网络大会。维基研讨会将研究人员聚集在一起,探讨维基媒体网站的各个方面,必威买球如维基百科,Wikidata,和维基共必威买球享资源。征文启事现在有空。在会议记录上发表论文的截止日期是1月28日,其他所有的报纸都在3月11日。

看到Meta-wiki上的研究事件页面对于其他即将举行的会议和活动,包括提交截止日期。

最近其他出版物

其他最近未能在本期中及时报道的出版物包括下列项目。欢迎贡献用于审查或总结新发表的研究。

编制的蒂尔曼拜耳

OpenSym2017

  • “维基数据和维基百科有什么共同点?:外部引用的使用分析”[4]摘要:“我们的研究结果表明,尽管只有少量的资源可以在Wikidata和Wikipedia上直接重用,引用通常指向相同的域。此外,维基数据似乎较少使用以英美为中心的来源。
  • 《通天塔一瞥:维基数据的多语言分析》[5]摘要:“我们从现在开始探索维基数据中的语言状态,特别是在本体论方面,和维基百科的关系。此外,我们通过将维基数据与母语者的分布进行比较,在现实世界中设置了多语种维基数据。我们发现现有的语言分布不均,这在本体论中不那么紧迫,以及未来改进的前景。”
  • “在‘我们’意识之前:身份工作作为从大规模协作到群体涌现的桥梁”[6]从这些采访中,我们在2007年维基百科的“大天鹅”文章中发现了一篇专题文章(fa)的合作,这对后来的小组工作非常重要。本文的重点围绕着这篇基础文章。”必威买球

从“维基百科内插质量动态”中的说明和演示Keilana效应”
图像中EpochFail(亚伦Halfaker),4.0 CC冲锋队

  • "在维基百科中插入质量动态并演示Keilana效应"[7]摘要:“我描述了一种在维基百科上测量文章质量的方法,这种方法的粒度比以前更细。我使用这种方法来演示Wikipedia中一个重要的动态覆盖率(具体来说,关于女科学家的文章)并提供这种方法,数据集,向研究维基百科质量动力学的研究团体开放API。必威体育 betway appMeta-wiki上的研究项目页面)

请参阅我们之前对另一篇OpenSym 2017论文的报道:通过深度学习提高文章质量预测他说:“这是一个很好的选择。”

OpenSym 2016

  • “挖掘团队特征预测维基百科文章质量”[8]摘要:“本实验获取西班牙语维基百科数据库转储,并应用适用于大数据集的不同数据挖掘技术,根据文章质量对整组文章进行标签(与精选/优秀文章进行比较,或FA / GA)。然后我们创建了描述撰写文章的团队特征的属性,并使用决策树方法,我们得到了产生FA/GA的团队最相关的特征。团队的最大效率和贡献的总长度是最重要的预测因素。
  • “通过LSTMs预测用户贡献的质量”[9]在讨论部分:“我们提出了一种机器学习的方法来预测维基百科修订的质量,这种方法可以利用用户完整的贡献历史来预测他们最新贡献的质量。而不是使用基于用户贡献历史计算的特别摘要功能,我们的方法可以直接将用户执行的所有编辑操作的信息作为输入。功能,如“时间间隔上一页修订”,添加或删除的字符数,"在页面中传播变化"“大小写比例”,以及“一周中的某一天”]。我们的方法利用了LSTMs (长短期记忆神经网络),以处理用户的可变长度供款历史。”

描述变化的图形,2014年10月至2016年1月在女性传记文章的绝对数量(横轴)及其在所有传记中所占的份额(纵轴)中,对于各种维基百科语言(以类似的形式出现在“监测性别差距…”论文中)
图像中Maximilianklein,4.0 CC冲锋队

  • “使用Wikidata人类性别指标监测性别差距”[10]摘要:“维基百科内容中的性别差异,特别是女性在传记中的表现,是众所周知的,但一直难以衡量。此外,努力解决这一性别差距的影响很少受到注意。为了调查我们使用维基数据,维基百科的数据库,和介绍“维基数据人类性别指标”(WHGI),一个免费开源的,纵,监测不同时期性别差异的传记数据集,空间,文化,职业和语言。通过这些镜头,我们展示了女性在11个维度上的表现是如何变化的。WHGI的验证是针对三个外生数据集提出的:世界历史人口,“传统”性别差异指数(GDI,盖伊,gggi和sigi)以及美国劳工统计局的职业性别。必威买球维基媒体基金会拨款页必威买球面)
  • “维基数据和协作知识库的财产推荐系统的实证评估”[11]摘要:“主动进入的用户,Wikidata上的审阅和修改数据由一个属性建议系统提供帮助,该系统为用户提供可能也适用于给定项的属性。我们将目前在Wikidata上使用的[推荐]方法与RDF推荐系统和协作信息系统领域的两种最先进的推荐方法进行了比较。此外,结合这些方法对混合推荐系统进行了评价。我们的评估表明,当前的推荐算法在查全率和查准率,召回率达到79.71%,准确率达到27.97%。”
  • “维基百科医学:开放科学项目中科学知识的构建”[12]摘要:“我的研究目标是建立一个理论框架来解释维基百科等基于众包的环境中知识建设的动态,并根据动态网络数据判断医学文章的可信度。通过应用actor-network理论社会网络分析,我的研究的贡献是理论和实践的,即建立一个关于维基百科跨时代知识构建动态的理论,并通过更好地理解编辑如何相互作用来构建健康科学内容,为发展公民科学众包平台提供见解。
  • '“OSM区域边界数据与DBpedia比较”〔13〕摘要:“开放地图(OSM)是一种著名的、广泛使用的地理数据数据源。这类数据也可以在维基百科上以地理位置的形式找到,如城市或国家。在地理坐标旁边,此外,还可以提供这些元素面积的统计数据。本文采用不同国家的OSM数据来计算有效边界(多)多边形的面积,并与各自的边界面积进行比较DBpedia(维基百科的大规模知识库摘录)条目。

请参阅我们之前对另一篇OpenSym 2016论文的报道:通过更好的wikilinks更容易在文章网络中导航他说:“这是一个很好的选择。”

多样的其他报纸,与结构化数据相关

图来自“Scholia and scientometrics with Wikidata”(截图)https://tools.wmflabs.org/scholia/author/q20980928)
通过芬恩奥雅纳尼尔森,cc0 1

  • "Scholia和科学计量学与维基数据"〔14〕摘要:Scholia是一个处理维基数据中科学书目信息的工具。Scholia Web服务为研究人员创建实时的学术资料,组织中,期刊,出版商,个人学术作品,以及研究主题。为了收集数据,它查询基于sparql的Wikidata查询服务。
  • “将Wikidata链接到语义Web的其他部分”〔15〕
  • “Chaudron:扩展DBpedia与测量”[16]摘要:“我们提议从维基百科垃圾堆中提取传统的地图创建方法,还可以使用呈现的HTML来避免模板转换问题。这个数据集扩展了DBpedia,在DBpedia覆盖的每个域上有390多万个三元组和949.000个测量值。[…]一项针对dbpedia和wikidata的广泛评估表明,我们的方法在很大程度上超过了它在wikipedia信息箱上的测量提取的竞争对手。Chaudron展览AF1分数而DBpedia和Wikidata在这个提取任务上分别达到0.38和0.10。”
  • 评估和改进DBpedia中的领域知识表示[17]摘要:我们评估了DBpedia在领域知识表示方面的质量。我们的研究结果表明,dbpedia在这方面仍有很大的改进空间,尤其是对概念的描述及其与DBpedia本体的联系。根据这个分析,我们利用开放式关系提取和dbpedia上已有的信息来部分纠正这个问题,通过提供从维基百科摘要中提取的新关系,并使用dbo:type谓词发现实体类型…”
  • “DBpedia构建实例属性的总结和规范化案例研究”[18]摘要:“DBpedia本体论(保存)了数千座重要建筑物和纪念碑的信息,从而使DBpedia成为建筑遗产的国际数字存储库。这些建筑结构的知识,为使其充分用于学术研究和其他目的,必须均质,作为其最丰富的资源——Wikipedia infobox模板系统——它是一个异构和非标准化的环境。下面的工作总结了建筑物最广泛使用的特性,对结构和语义上的异种进行分类和突出显示,允许dbpedia的用户充分利用可用信息。”
  • “经验:DBpedia和Freebase上的类型对齐”[19]来自摘要:“……许多不同类型的实例。)可在已出版的[相关公开数据]数据集。类型对齐是在两个这样的数据集之间自动匹配类型(可能有很多种方式)的问题。类型对齐是实例匹配中的一个重要预处理步骤。实例匹配涉及到标识引用同一基础实体的实例对。通过预先执行类型对齐,只有符合对齐类型的实例才一起处理,从而节省大量资金。本文介绍了两个大型跨域RDF知识图的类型对齐经验。DBpedia和毒品,包含数百个,甚至数千人,独特的类型。具体地说,我们提出一个MapReduce-基于类型对齐算法…”
  • “高吞吐量和语言无关的实体消除歧义和对用户生成数据的链接”[20]预印本(未提及Wikidata):“我们的知识库[知识库包含约100万个用于实体的Freebase机器id。它们是从所有映射到Wikipedia实体的Freebase实体的子集中选择的。我们更喜欢使用freebase而不是wikipedia作为知识库,因为在freebase中,同一个ID表示跨多种语言的唯一实体……我们为我们的EDL系统生成了一个地面实况数据集,维基百科上注释密集的文本(DAWT),使用维基百科的文章。维基化是以知识库的形式与维基百科链接的实体。我们从维基百科的数据转储开始,通过在现有的文档结构中引入更多的超链接,进一步丰富了这些内容。作为最后一步,为了适应我们的知识库,以特定语言编写的Wikipedia文章的超链接被它们的Freebase id的链接所替代。我们还计划把维基百科作为我们的知识库。
  • “使用COOL-WD管理和使用Wikidata的完整性信息”[21]摘要:我们讨论了如何管理和使用关于Wikidata完整性的元信息。[…]我们通过COOL-WD (网址:http://cool-wd.inf.unibz.it/),请Wikidata的完整性工具,它目前收集了大约10000个真正的完整性声明。相关的论文)
  • “查询Wikidata:比较SPARQL,关系数据库和图形数据库”[22]摘要:为了查询维基数据库知识库,我们对各种数据库引擎的效率进行了实验比较。
  • 具体化RDF:维基数据有什么用?[23]摘要:“…我们比较了使化RDF三元组。我们的目标是将Wikidata表示为零售配送中心,这将允许遗留语义Web语言,技术和工具——例如,SPARQL引擎-用于Wikidata。然而,wikidata用限定符和引用注释语句,这就需要RDF模型的具体化概念。因此,我们研究了四种选择:基于sparql的维基数据搜索引擎已经有了。)

参考文献

  1. 安托尼尼,赛(2017-06-22)。“Lude la v_racit_des Articles M_dicaux sur wikip_dia”。Aix马赛大学。
  2. Lewoniewski,W_Odzimierz;Krzysztof,Węcel;Abramowicz,威托德(2017-06-22)。“多语种维基百科的相对质量和流行性评价”。信息学2017,4(4),43.
  3. Sahut,Gilles;经编针织物,Andr_(2017-10-31)。维基百科:一个重新思考信息源可信度之间联系的机会,信任,和权威”第一个星期一 22(11)。石头1396 - 0466doi10.5210 / fm.v22i11.7108。检索2017-12-17
  4. Piscopo亚历山德罗;Vougiouklis,帕夫洛斯;KaffeeLucie-Aimee;山鸡,克里斯托弗•;兔子,乔纳森;Simperl,埃琳娜(2017)。维基数据和维基百科有什么共同点?:外部引用的使用分析 (PDF)。OpenSym 17。纽约,纽约,美国:ACM。1-1-1:10页。国际标准图书编号9781450351874doi10.1145/3125433.3125445
  5. KaffeeLucie-Aimee;Piscopo亚历山德罗;Vougiouklis,帕夫洛斯;Simperl,埃琳娜;卡尔,莱斯利;粗柴油高温裂解,Lydia(2017年)。巴别塔的一瞥:维基数据多语言性分析 (PDF)。OpenSym 17。纽约,纽约,美国:ACM。14-1-14:5页。国际标准图书编号9781450351874doi10.1145/3125433.3125465
  6. Lanamaki,阿尔托;Lindman,Juho(2017年)。在“我们”意识之前:身份工作是从大规模合作到群体出现的桥梁 (PDF)。OpenSym 17。纽约,纽约,美国:ACM。5-1-5:9页。国际标准图书编号9781450351874doi10.1145/3125433.3125451
  7. 哈法克亚伦(2017)。在维基百科中插入质量动力学并演示凯拉纳效应 (PDF)。OpenSym 17。纽约,纽约,美国:ACM。第19–1–19:9页。国际标准图书编号9781450351874doi10.1145/3125433.3125475
  8. Betancourt恩典Gimon;Segnine,阿曼多;Trabuco,卡洛斯;Rezgui,阿米拉;朱利安,尼古拉斯(2016)。挖掘团队特征预测维基百科文章质量。OpenSym 16。纽约,纽约,美国:ACM。第15–1–15:9页。国际标准图书编号9781450344517doi10.1145/2957792.2971802
  9. Agrawal,狗屎;德尔法罗卢卡(2016)。通过lstms预测用户贡献的质量 (PDF)。OpenSym 16。纽约,纽约,美国:ACM。19-1-19:10页。国际标准图书编号9781450344517doi10.1145/2957792.2957811
  10. 克莱恩,马克西米利安;KoniecznyPiotr;朱,海逸;意大利广播电视公司,Vivek;古普塔苛刻(2016)。利用维基数据监测性别差距人类性别指标 (PDF)。OpenSym 2016。柏林德国。P 9。
  11. Zangerle,伊娃;Gassler,沃尔夫冈•;皮克尔,马丁;steinhaus指出,Stefan;Specht,冈瑟(2016)。维基数据与协同知识库属性推荐系统的实证评估 (PDF)。OpenSym 16。纽约,纽约,美国:ACM。18-1-18:8页。国际标准图书编号9781450344517doi10.1145/2957792.2957804
  12. Tamime,Reham基地;霍尔温迪;佐丹奴Richard(2016年)。维基百科医学:开放科学项目中科学知识的构建 (PDF)。OpenSym 16。纽约,纽约,美国:ACM。4-1-4:4页。国际标准图书编号9781450344814doi10.1145/2962132.2962141(扩展摘要)
  13. Silbernagl,多丽丝;Krismer,尼古拉斯;Specht,冈瑟(2016)。将OSM区域边界数据与DBpedia进行比较 (PDF)。OpenSym 16。纽约,纽约,美国:ACM。11-1-11:4页。国际标准图书编号9781450344517doi10.1145/2957792.2957806
  14. 尼尔森芬恩奥雅纳;Mietchen,但以理;Willighagen,大多(2017-05-28)。Scholia,科学计量学和维基数据。欧洲语义网络会议。计算机科学的课堂讲稿。Springer查姆。第237页-第259页。国际标准图书编号9783319704067doi10.1007 / 978 - 3 - 319 - 70407 - 4 - _36
  15. 安德拉·瓦格梅斯特,大多Willighagen,Nuria Queralt Rosinach,艾薇拉·米特拉卡,Sebastian Burgstaller-Muehlbacher蒂姆·E。核,茱莉亚•特纳林恩M Schriml,保罗•Pavlidis安德鲁我苏,本杰明:好的。将Wikidata链接到语义Web的其他部分。第九届国际会议论文集:生命科学语义网络应用和工具。阿姆斯特丹,荷兰,12月5 - 8,2016.(会议海报)
  16. Subercaze,Julien(2017年5月)。Chaudron:用度量扩展DBpedia。Portoroz,斯洛文尼亚:Eva Blomqvist,戴安娜梅纳德Aldo Gangemi。
  17. Ludovic字体A,阿玛尔Zouaq,B,米歇尔Gagnon:DBpedia领域知识表示的评估与改进
  18. Agathos,Michail;Kalogeros,埃列弗特里奥斯;KapidakisSarantos (2016-09-05)。“DBpedia构建实例属性的总结和规范化案例研究”。在诺伯特·富尔,l_szl_kov_cs,托马斯·里塞,沃尔夫冈Nejdl(eds)。数字图书馆的研究与先进技术必威体育手机苹果app下载。计算机科学的课堂讲稿。斯普林格国际出版公司。第398页-第404页。国际标准图书编号9783319439969。检索2016-08-27 关闭访问
  19. 凯吉瓦尔迈阿克;MIRANKER,丹尼尔。P。(2016年)。“经验:DBpedia和Freebase上的类型对齐” (PDF)ACM:10。
  20. 巴尔加瓦Preeti;Spasojevic,维迪奇;胡Guoning(2017-03-13)。“高吞吐量和语言无关的实体消除歧义和对用户生成数据的链接”arXiv:1703.04498(cs)
  21. Prasojo,Radityo Eko;Darari,Fariz;Razniewski,西蒙;纳特沃纳。使用COOL-WD管理和使用Wikidata的完整性信息 (PDF)。KRDB,bozenbolzano自由大学,39100年,意大利。
  22. 埃尔南德斯,但以理;霍根,艾丹;rivero,克里斯蒂安;罗哈斯,卡洛斯;Zerega,恩佐(2016-10-17)。查询wikidata:比较sparql,关系数据库和图形数据库。国际语义网会议。计算机科学的课堂讲稿。Springer查姆。88 - 88页。国际标准图书编号9783319465463doi10.1007 / 978 - 3 - 319 - 46547 - 0 - _10 关闭访问 作者的预印本
  23. 埃尔南德斯,但以理;霍根,艾丹;Krotzsch,马库斯(2015)。具体化RDF:维基数据有什么用?具体化RDF:维基数据有什么好的功能?。第十一届可伸缩语义Web知识库系统国际研讨会论文集。CEUR研讨会论文集1457。32-47页。

必威买球维基媒体研究通讯
第7卷•发行日期:2017年9月9日
本通讯由必威买球维基媒体研究委员会的路标
订阅:辛迪加维基媒体研究通讯提要必威买球 电子邮件 WikiResearch在推特上 在Facebook上WikiResearch[ 档案) (路标版) (贡献) [研究索引]