华佗百科:机器人/提议

华佗百科,全民书写的医学百科全书!
跳转至: 导航搜索

如果你希望那些功能机器人可以实现,可以在下面写出,大家也可以讨论是否支持这种机器人的出现,机器人的制造者们有可能会考虑去实现你的设想。请将新提议放在最后面,并将已经解决的和陈旧(半年未讨论的提议)存档。


数据类

管理类

按机器人的功能分类。

复原

  • 监察破坏的机器人:现时英文华佗有一位机器人en:User:AntiVandalBot专门负责监察页面破坏,例如在发生清空条目破坏时迅速回复页面,并在清空者的用户讨论页上自动留下警告讯息,但不会自动查封用户。据介绍准确度98%。我想我们可以考虑一下这种机器人。--Charlotte1125 06:05 2007年1月4日 (UTC)
  • en:WP:TROLL的定义应该是很严苛的,当然更不可能由机器人来侦测,所以在这里还是先别管trolling,回到侦测破坏上吧。en:User:ClueBot是我目前看到最聪明的机器人了,最近看过的英文条目,检查历史时如发现曾有破坏,往往是ClueBot将其复原的,实在命中率高动作又快。不知道有没有人对bot制作熟稔的能参考en:User:ClueBot/Source做一个适合中文华佗的bot出来。我稍稍研究了一下,西文的bot有个优势是往往能从“没有大写”或“全部大写”判断出是破坏,相对来说中文bot要抓破坏就没那么简单了……—雅言
  • 当然,机器人根本无权管 trolling 。但我以往见中文华佗百科 trolling 多,而破坏少,所以机器人用途不大。不然,大家可先用粗略归纳出中文华佗百科的通常破坏模式(?pattern),然后再决定如何编写。判断的(复合)标准可包括:字数;== == 、[[ 与 {{ 的对称/完整性;关键字词(适用于非中文的破坏,例如 Vandal!!!)等;但要先有资料,讨论才有意义。


修改

(+)同意,把错误更正为正确是一件好事
  • 根据Help:注脚#格式指引的说明,注脚标签应放在标点前,但眼见这里充斥着大量与这个指引背道而驰的条目,因此建议设立一个机器人,自动将逗号、句号、分号等标点后的注脚放到标点前。
(-)反对在未有社群共识前,用机器人制造“既定事实”。
注脚置于标点后方是不正确的,这里不是英语华佗,大量的用户没有改正使得错误一再延续。
  • 建议增加一个更新中文分类的机器人。自动检查不包含拼音关键词的分类并自动转换修改。以解决中文分类页面中排序的中英混杂问题。
反大规模涂鸦的程序

草拟了一套基本的反大规模涂鸦的程序,可以一次过清除、移回、删除(或提删)一个用户的(近期,得自api.php )编辑。初步测试过(botwiki:special:contributions/hillgentleman),仍有 bug,但可将就用。见botwiki:python:revertAll.py。语言为python + pywikipedia 架构 + botwiki:python:userContributions.pyR. Hillgentleman

检视格式

  • 消除句子中与数据或外文无关的空格;
  • 消除重复的标点符号(如“,。”或“。。”);
  • 消除段落前空格(段落前加空格形成方框);*
  • 替换标点符号(将文段中的“, ”(与数据无关)、“. ”(与数据无关)、“""”、“()”及“...”等分别替换为“,”、“。”、““””、“()”及“……”);
  • 替换波浪线(将“~”或“~”替换为“-”)
  • 检索缺少标点符号的语句(如“若是测试 请改用沙盒 我们鼓励您改善百科 但破坏性修改会被华倾家荡佗社群迅速清除 ”);
  • 检索非叠词重复字眼(如“切勿切勿侵犯著作权”);
  • 检索重复语句及段落;
  • 检索引文外“我”、“你”等人称代词的使用;
  • 检索引文以外的感叹号及省略号的使用;
  • 检索没有在第一句话中使用粗体字的条目;
  • 检索没有使用内部连接的条目。

I.R.A.File:Core.gif