精通
英语
和
开源
,
擅长
开发
与
培训
,
胸怀四海
第一信赖
锐英源精品开源心得,禁止全文或局部转载,禁止任何形式的非法使用,侵权必究
最近换了网页编辑器,从DreamWeaver换到了Sublime Text,再换到了NetBeans,这换来换去时,发现编辑的HTML文件编码格式突然变了,如下图:
这个360_enter.html文件因为在搜索结果里很突出,印象很深,肯定是收录了,所以UTF-8 BOM格式是不影响收录的,BOM是字节顺序标记,有没有BOM都可以归类为UTF-8系列,但不是UTF-8。
不过建议最好所有网页文件格式一致,因为搜索引擎的爬虫可能会对网页格式有标记,文件格式前后不一致,和标记有冲突,影响爬虫理解。
我网页文件原来格式是UTF-8,首页也是UTF-8,换编辑软件可能导致了出现UTF-8 BOM,幸亏还是一个系列,如果是其它的不知道有没有影响。
我是把HTML文件另存为新网页来编辑,有的继承了UTF-8,有的继承了UTF-8 BOM,网页文件格式变来变去,360_enter.html是没有问题,但是感觉后面收录的很慢,索引量并不怎么增长,每天发了好几篇,索引量涨涨跌跌,估计和编码变来变去有关系,劝大家格式一定到一致。
动态网页一般没这个问题。