XML站点地图& Google新闻
插件描述
本插件能够动态创建符合 XML站点地图与 Google新闻站点地图协议规范的内容源(Feeds)。本插件与多站点(Mltisite), Polylang , WPML 相兼容,且不会创建额外文件。用户可以通过诸多选项来控制启用何种站点地图,应当收录何种文章类型与分类,优先级与最后更新(LastMod)应当如何计算,在新内容发布时谁应当得到通知(Ping),还可以在WordPress管理员面板内配置额外Robots.txt规则。
本插件相比起其他XML站点地图插件的优点在于其简易性。它不需要你修改文件或文件夹权限,不需要移动文件或者在那些困难复杂的插件选项上耗费时间。
你或者你所属的多站点网络的所有者,不必为其它大多数XML站点地图插件那般复杂的设置而烦心。本插件的默认设置已足以应对大多数情况。
一般情况下,一份依照默认设置收录文章与页面的XML站点地图索引将在 yourblog.url / sitemap.xml (如果你不使用“友好(Fancy)”的固定链接结构,则该链接为yourblog.url /?feed = sitemap)中立即可用,随时等待诸如Google, Bing,Yahoo,AOL,Ask等搜索引擎索引或抓取。当启用Google新闻站点地图时,站点地图将在 yourblog.url / sitemap-news.xml (或yourblog.url /?feed = sitemap-news)中立即可用,并随时等待谷歌新闻索引抓取。它们二者都将被动态创建的 yourblog.url / Robots.txt 路径下的 Robots.txt 文件自动引用来告诉搜索引擎应该在哪抓取XML站点地图.Google与Bing将在每一次文章发表与更新时收到提醒。
请阅读常见问题解答来了解如将来自谷歌新闻中获取你的文章列表。
目前插件已与WP超级缓存,W3总缓存,快速缓存等能够对订阅源进行缓存的插件相兼容。从而能够更快地服务那些了无耐心(特别是它们饥饿不堪时)的爬虫。
注意:
如果你不使用友好链接(花哨的URL)或你的WordPress安装在一个子目录中,则动态Robots.txt文件将不会生成。你必须自行创建并自行上传一个机器人。 txt文件到你的网站的根目录中。详情请参阅FAQ。
对于大型站点,我们建议你使用一款优秀的缓存插件,例如 WP Super Cache ,快速缓存或 W3总缓存来提升你的网站与站点地图的性能。
功能
对使用 Polylang WPML 的网站进行兼容,可以平等地收录并索引每一种语言的内容。该选项用以增加新的Robots.txt规则。这些规则可以用来进行进一步控制(阅读:限制)站点各部分的索引,以及您站点页面在后续传播中的页面等级(PageRank)。包含XLS样式表,使站点地图更加易读。
XML站点地图
站点地图索引提供基于文章类型,基于类别与基于标签几种索引模式。可自加义URL的站点地图。可添加静态或自定义站点地图到索引中。工作出色,甚至在多站点安装环境中亦可顺畅运行。可以在站点地图中包含带有说明的图像标签,或为特色图像或附加图片设置标题。当新文章发表时通知(Ping)Google,Bing与Yahoo。用以配置何种文章类型与何种分类应当收录于站点地图中的选项在文章发生了修改,或有了新评论时,更新LastMod。为每篇文章,每个分类或是每种文章类型设置优先级。排除独立文章或页面。
谷歌新闻网站地图
可以在站点地图中包含带有说明的图像标签,或为特色图像或附加图片设置标题。可以通过选项设置不同的新闻出版物名称,包括自定义文章类型或制收录某一特定文章类别。每当有新内容发表时,会自动通知(Ping)Google与Bing。
隐私政策/ GDPR
本插件不会收集任何用户或来访者数据,也不会配置浏览器Cookies。使用本插件不会在任何方面对你的网站的隐私政策造成影响。
会被公开的数据
一份XML站点地图索引,将指向其它具体的站点地图,包含你的网站指定文章类型且业已公开的文章的链接,同时还包含它们的最后修改时间以及相关图片链接,以及其它任何选择的公开存档的链接。
Google新闻站点地图包含了你的站点的公开与最新(过去48小时内)的指定新文章类型的内容,还包括它们的时间戳与相关图片的链接。
会被传输的数据
会主动传递给搜索引擎的数据包括你的站点地图位置,以及给类内容的发布时间。如果设置撰写内的通知(平)选项中,指定了至少一家搜索引擎,那么每当有一篇文章公开发表时,插件都会主动将数据传递给搜索引擎。在此情况下,搜索引擎将会收到有关你的站点地图的位置以及更新状态的提醒。
如何贡献
如果您喜欢这个插件,请考虑为本插件写一个短评或在支持论坛上帮助其他用户。
如果您有意与我们一同完善本插件,欢迎您帮助我们将插件翻译成您的语言,或是在 Github 上贡献代码。
致谢
XML Sitemap Feed(现XML站点地图和谷歌新闻)插件最初基于由Patrick Chia编写的标准XML站点地图生成器插件进行开发。自那时以来,本插件已经经完全重构并在多个方面有所扩展。
截图


安装
WordPress
一,如果在此之前你正在使用其他XML站点地图插件,请检查你的网站根目录并移除所有已存在的sitemap.xml,sitemap-news.xml以及Robots.txt(如果其不是由你手工创建并维护的)文件。
二,通过以下方式安装插件:
通过 涵盖网络服务 来进行快速安装!
…或者…
在插件→安装插件管理页面中搜索“xml sitemap feed”或“XML站点地图”并安装。
…或者…
依照如下步骤:
下载档案
将Zip文件通过“插件→安装插件→上传页面”上传或者直接解压并通过你最喜欢的FTP客户端上传到/ plugins /文件夹。
三,在插件页面中激活插件。
搞定!现在你可以通过浏览器或任何在线XML站点地图验证访问你的博客.tld / sitemap.xml来检查你的闪闪发亮的全新XML站点地图。你可能同时也想要检查你的站点地图是否已收录于你的yourblogurl.tld / robots.txt文件中,别忘了。
WordPress 3+多站点模式
步骤同上,为你的多站点网络中的每一个网站进行网络激活以确保XML站点地图能够对每一个网站启用。
如果本插件与 WordPress MU全站标签页同时安装,XML站点地图将不会对任何标签博客(标签博客)创建sitemap.xml文件同样也不会对Robots.txt文件做任何修改。这是故意如此,因为这可能导致标签博客在自己的域名之外被大量站外链接所填满,这将导致网站被谷处以忽略(忽略)(甚至更糟:惩罚(惩罚))的措施。
卸载
通过仪表盘的插件页面卸载本插件后,大部分插件选项与配置都将从数据库中清除。仅有关于每篇文章的专门设置,如文章优先级配置或是排除选项,分类,以及最后修改时间等都将以休眠状态保留在数据库中。详细说明请参阅uninstall.php中的注释部分。
在多站点环境中,uninstall.php文件可以在网络中的所有站点中循环运行卸载过程。然而,这一卸载方式并不适配于大型站点网络,该文件唯有在wp-config.php文件中明确配置 define('XMLSF_MULTISITE_UNINSTALL',true);
选项时才会对每一站点进行卸载操作。
FAQ
插件设置在哪里?
在设置阅读中你可以启用XML站点地图索引与Google新闻站点地图(如果需要)。同时该部分还提供了额外的robots.txt规则配置区域。
只要站点地图被启用,它的相关设置便可在设置XML站点地图或是设置Google新闻中找到。
通知(Ping)设置可以在设置撰写中找到。
我该如何获得谷歌新闻列出的我的最新文章?
前往谷歌新闻发布商中心并提交你的网站信息,越详细越好。记得在底部“其他”部分的文本框中向他们提交你全新的谷歌新闻站点地图链接。
你可能还需要向你的谷歌站长管理工具帐号中增加你的站点地图,并确认其有性与运行效果。如果你还没有相关帐号,先注册一个。
我可以人工干预优先级与changfreq数值吗?
可以。你可以在设置XML站点地图中找到有关优先级属性的默认配置。你也可以在文章设置中为单篇文章设置一个固定的优先级。
由于Google已不再将其纳入考虑,自4.9版本起,弃用Changefreq。
我需要向搜索引擎提交站点地图吗?
不需要。在正常情况下,你的网站将在你发觉之前便被主流搜索引擎索引完毕。搜索引擎将会查看Robots.txt文件并(在本插件激活的情况下)找到指向你的博客的XML站点地图的指针。搜索引擎将会定期返回以确认你的站点是否更新了任何内容。 123>
此外,Google与Bing将默认在每次新文章发表后收到通知(Ping)。
注意:如果你的服务器没有重定向规则,你的博客没有使用友好链接(Fancy URL)(意即你正使用采用旧版默认设置的WordPress永久链接结构),或者的站点安装于一个子目录,则你需要阅读我需要修改我的Robots.txt文件吗?以了解更多信息。这个插件会通知(pi ng)搜索引擎吗?
是的.Google与Bing将会在每次新文章发表后获得自动通知。除非你在
设置撰写中禁用此功能。我需要修改我的Robots.txt文件吗?
在一般情况下,如果你的站点根目录下没有一份静态的robots.txt文件,那么站点地图的地址将自动添加进由WordPress动态生成的robots.txt文件中。
如果正在使用放置于你网站根目录下的静态Robots.txt文件,你可能需要在一款文本编辑器中打开它进行编辑。如果其中已经存在形如
网站地图:http://yourblogurl.tld/sitemap.xml 的一行,你可以就这么将其关闭并离开。但如果文件中没有站点地图的指向,将该行(记得将网址替换为你的站点的地址)
或者如果你的WordPress安装在一个子目录下,或者你使用的服务器为配置重定向规则,或者你未在你的永久链接结构设置中采用友好链接(Facny URL,即永久链接),如果你符合此类情况,WordPress需要获得一些小协助以为XML站点地图索引站点内容做好准备。阅读
WordPress 部分以了解更多信息。我的博客采用的WordPress系统安装在一个子目录下。这是否会造成什么改变?
这取决于你的index.php与.htaccess文件被安装到何处。如果它们都被放置在根目录下,同时其它余下的WP文件都被放置在子目录下,那么你的站点便可以通过你的域名直接访问,不需要再进行其它操作。插件应当开箱即用。
但是,如果你的index.php和你的wp-config.php以及其它所有WP文件都放置在同一个子目录中,就意味着你的博客只能通过该子目录来访问,因此你需要自己在你的
域名根目录下管理你的robots.txt文件.Robots.txt文件必须放置在根目录(!)中,并且文件内应当有单独一行以网站地图:起头,后面写入XML站点地图插件提供的你的站点地图的完整地址。就像这样:
站点地图:http://yourblogurl.tld/subdir/sitemap.xml
如果你业已拥有一个写有其它站点地图地址的Robots.txt文件,只需在该地址上方或下方添加一行全线。
我需要配置友好(Facny)永久链接结构吗?
并非如此。虽然我仍会建议你采用任何一种更好的永久链接结构以促进更便利的索引或许你不能够(或是不愿意)去修改它们,即使在此情况下,你依旧可以使用本插件:
检查链接yourblog.url /?feed = sitemap是否提供了一个订阅源。现在手动向你的网站根目录下保存的你自己的Robots.txt文件中上传如下字段:
网站地图:http://yourblog.url/?feed = sitemapUser-agent:*允许:/
你也可以选择手工通知主流搜索引擎有你的站点地图更新。要想这么做,首先先创建一个
谷歌站长工具箱帐号并提交你的站点地图,在你首次提交后谷歌便会对其启用自动跟踪与下载。除此之外,你也可以在 XML-Sitemaps.com 上提交你的站点地图链接。我可以修改站点地图的名称或链接吗?
答案为否。如果你在WordPress启用了友好链接(花式URL ,WordPress称为“永久链接”),那么你手动(如果你已失去耐心)提交给Google的站点链接应为
yourblogurl.tld / sitemap.xml 。但如果你的永久链接设置为默认配置,则订阅源链接只会有
yourblog.url /?feed = sitemap 有效。
在我的网站根目录下找不到sitemap.xml文件!
实际上没有任何实在文件会被创建。站点地图是如同订阅源(feed)一般动态生成的。
我在网站根目录下找到了sitemap.xml文件但是看起来它没有得到更新!
你可能在使用本插件之前使用了其他的XML站点地图插件,你正在查看sitemap.xml文件就是由其所创建的。删除该文件并让本插件动态生成站点地图,一如生成订阅源那般。本插件不会创建任何实际的文件。
如果实际情况并非如此,你可能正在使用缓存插件,或者你的浏览器没有获取最新的订阅源输出。请进行检查。
我使用了缓存插件但是站点地图没有被缓存。
一些缓存插件会提供是否对订阅源与站点地图进行缓存的选项。请确保它们处于启用状态。
插件
W3总缓存/ 的开发者Frederick Townes说:“在页面缓存设置标签页中有一个针对是否缓存订阅源与站点地图的复选框。它们的过期时间将根据浏览器针对HTML缓存设置的过期值所配置。“
谷歌新闻地图是以不缓存为出发点而设计的。
当我试图打开站点地图或Robots.txt时遭遇错误!
你所需要做的第一件事定然是确认你的博客的隐私设置。前往
设置→隐私以确认你已允许搜索引擎索引你的网站。如果你禁止了该项,你的站点地图将不会提供。
然后,你需要确保至少有1篇文章处于公开状态。目前已知WordPress将会在没有文章时对订阅源请求返回404状态。即使插件试图阻止这一返回,在某些情况下错误的状态头仍会发送,同时谷歌站长工具箱会发出含糊不清的错误报告,例如:
我们在尝试访问您的站点地图时遇到错误。请确保您的站点地图遵循o您的指南可以在您提供的位置访问,然后重新提交。
如果这些措施都不能解决本问题,请确认下面这些错误及其各自的解决方案是否存在或有效:
出现404页面而非我的sitemap.xml页面
尝试刷新WordPress的永久链接结构。前往设置→永久链接重新保存一次设置。接着在清除你的浏览器缓存后尝试重新加载XML站点地图。(你也可以尝试通过Ctrl + R来绕过浏览器缓存强制刷新 – 它能在大部分,但非所有的浏览器中工作。)
出现404页面,sitemap.xml与Rotobts .txt文件均无法找到。
有些插件,诸如E.发泄日历(至少从V3.2 Btea2起)已知存在重写规则的混乱,会导致WordPress内部订阅源与Robots.txt文件的生成出现问题,因此它们与XML站点地图订阅源插件是存在冲突的。你可以尝试停用所有插件来查看你是否能获得一个包含基础信息的Robots.txt文件形如:
用户代理:*不允许:
你需要一次一个地重新激活你的以确认是哪一个插件造成了该问题。然后将其报告给该插件的开发人员。
Robots.txt返回404页面但sitemap.xml正常工作
目前WordPrss有一个已知问题(至少在2.8版之前),即在
没有文章处于已发布状态时将不会创建Robots.txt文件。如果你正使用WordPress驱动一个CMS网站,而其中只有页面,这个问题将会影响到你的使用。 要想解决这个问题,你需要至少撰写一篇文章并将其设置为
私有
状态,你也可以手动为自己创建Robots.txt文件并包含如下内容:
站点地图:http://yourblog.url/sitemap.xmlUser-agent:*允许:/
并将其上传至你的网站根目录。
发生了未知错插件)会造成此错误的发生。虽然问题业已定位,但原因却尚无法弄清……除非我能找出为什么会发生这种事。不过请尽管放心,目前已知这个错误只会在通过一般浏览器阅读站点地图时产生影响,但不会影响搜索引擎对你网站的索引。
XML声明仅允许出现在档开始
当有空白行或其他输出内容生成于实际站点地图内容之前时,就会产生这一错误。这可能是由于wp-config.php或你使用的主题的functions.php开头存在空白行,或其它不该输出相关内容的插件生成并输出了内容,并插入到站点地图文件之前。你需要通过禁用所有插件并切换至默认主题,同时手动检查你的wp- config.php文件来测试是何种原因导致了这一问题。
在打开站点地图时我只看到一个空白页面。
有几种情况可能会导致本错误的发生。 在浏览器中打开你的站点地图并查看其源代码。这步操作通常可以通过快捷键Ctrl + U或在右键弹出菜单中选择“查看源代码…”来进行,你需要检查给出的源代码以判断其中是否存在错误。
A.如果你在源代码的头几行(Head标签)部分看见了奇怪的输出内,或者在你的安装内容中又冲突或错误存在,请前往
支持论坛
以寻求帮助。
B.如果源代码为空或者呈现为未完成状态,那么你遇到的问题可能与你的服务器的PHP内存限制有关。在这种情况下,你会在你的服务器或你的帐号的错误日志文件中找到形如
PHP致命错误:允许的内存大小xxxxxx字节用尽了。
这样的错误信息。 这种情况多发生于大型站点中。为避免这些问题,插件在设置阅读中提供了一个选项,允许将文章拆分至不同的站点地图中。你可以尝试不同的设置方式,并在每次设置完成后前往主站点地图并打开其中列出的不同的站点地图进行测试。
你可以阅读为PHP增加内存分配(中文)
已了解更多信息,尝试分配高于256M的内存数值,或者向你的主机提供我咨询,你可以在WPMU / WP3 +多站点模式下安装这款插件吗?
完全可以。实际上,本插件就是为此而设计的。目前插件已在WPMU 2.9.2与WPMS 3+下经过测试,所有测试环境均正常激活并激活了网络激活与网站范围激活相关选项。
评论
RSS