sitemap文件必须使用UTF-8格式保存。以及所有标签内容都需要对下列字符进行转义:
&符号 & & 单引号 ' ' 双引号 " " 大于号 > > 小于号 < <
除此之外,需确保<loc>中的网址经过URL编码,以及符合RFC-3986(URI)规范、XML规范(对于IRIs符合RFC-3987)。
下面是一个采用非ASCII字符(ü)和需要进行实体转义的字符(&)的网址示例:
http://www.wdzzz.com/ümlat.html&q=name
经过编码和转义后的同一网址:
http://www.wdzzz.com/%C3%BCmlat.html&q=name