这是几周前很早的“新闻”了,据说Google和Yahoo对SWF进行了检索。这段时间一直忙着几个基于Facebook和校内API的应用,今天稍有空,简单分享一下我的心得。
(more…)
February 16, 2010
Google、Yahoo and SWF SEO
February 5, 2010
Flash SEO
基本上,Flash本来应该是个非常不利于搜索引擎的一种文件,起码一直以来大家都抱持着这样的疑问,认为Flash的内容应该是无法被搜索引擎所 搜索到,但是难道真的为了SEO就得放弃Flash?不过其实也不是完全无解,因为前几天工作上有人谈到这个问题,干脆就把资料整理整理吧!
首 先,虽然Flash可以用来制作整个网站,但是我依然不推荐这样做,除非你有办法把内容完全从Flash当中分离。当然,目前Google搜索引 擎已经可以解析Flash当中的连结内容,不过如果你过度使用Flash,又没有好好的把内容拉出来,在SEO上还是赢不了非Flash页面且符合网页标 准化规范的网页的喔!
但是如果非要在网页当中使用Flash,又该如何让它成为可以让搜索引擎轻易搜索的网页呢?
把Flash文件放在HTML文件当中,千万别忘了在META当中设计关键词和网页相关信息;或者你也可以在Flash文件下面放上Flash文件内容的相关说明,让搜索引擎也可以抓到相关的数据。
使用外部文字文件,让Flash的内容可以被搜索,并且确定你的文字内容对搜索引擎而言是有意义的,像是“点击这里”这种无意义的东西就不要放了。
伟大的Google搜索引擎会找出Flash里面的连结,所以,请对你的连结名称使用有意义的字,而不要没事老用一堆形而上的火星文,火星文是不会让你的文章变得比较容易搜索得到的!(管你用的是什么鬼符号,星星月亮太阳都一样啦!)
提供非Flash版本给搜索引擎,我想这是个非常好的方式,除了让使用者可以有所选择外,也可以对搜索有帮助。
正确的对你的文件命名,关键词以 ‘-’ 隔开,有助于搜索引擎的判断喔!另外,也不要把文件的深度弄得太深,例如:www/user/admin/file/,这种太深的数据夹结构,对于搜索是毫无帮助的。
另 外,想要把Flash文件放在网页当中,最好使用<script>语法,而非直接使用<object>或 是<embed>方式插入,因为这样一来,搜索引擎在看到<script>之后,就会自动跳过不去搜索;现在已经有很多可供选择 的Javascript程序,可以让你非常方便的在页面插入Flash文件。
使用<script>插入Flash的同时,最好加上<noscript>标签,提供给不支持script效果的使用者(包括搜索引擎)来阅读;总而言之,你就是要随时随地的去帮使用者设想,不要老是假设大家都支持Script或是Flash。
但是请注意一下,千万不要滥用<noscript>,在里面下莫名奇妙的内容企图提高SEO的排名,到时候被加入搜索黑名单可就欲哭无泪了!
结论是,Flash并不会造成SEO上的问题,未来的搜索引擎趋势也会变成可以全面搜索非HTML的文件,但是可以搜索不代表非得搜索,想要被搜索引擎搜索到,甚至提升自己的排名,最重要的还是提供有深度、有内容、并且值得让人找寻的东西。
针对FLASH的SEO全攻略
今天算是完整得读完了《SEO For Flash》 这本书,虽然该书是第一本关于怎么SEO Flash方面的书籍,但内容方面并没有让我有很多的惊喜,还是我所知道的内容和方法,只是它作了一个比较好的总结,难免有些失望啊。下面就结合自己的经 验,重新整理一下对Flex/Flash SEO的方法。
February 4, 2010
Flash全站SEO方式
目前,全FLASH站里头的文字很难给一般的搜索引擎捕捉到(可能以后GOOGLE会有改善吧),因为搜索引擎只分析HTML页面里头的文字(动态页面如 ASP,PHP那些也行,不过优先级会比较低),所以,FLASH在这方面是很吃亏的。之前也有人在这里发过关于FLASH的SEO问题,是通过 XHTML实现的,今天我要给大家介绍的是另一种方法:通过网页重定向以及我上一篇教程的FLASH站定位技术。
(more…)
January 23, 2010
中国站长最郁闷的几件事情
第一大当:CN域名
09年12月之前,注册CN域名意味着什么?意味着你拥有了一个属于自己的国内顶级域名。是的,当时所有人都是这样认为的,只要你按时续费,这个CN域名就一直属于你,并且按照官方的说法是受法律保护的。
January 22, 2010
如何写robots.txt?
在国内,网站管理者似乎对robots.txt并没有引起多大重视,应一些朋友之请求,今天想通过这篇文章来简单谈一下robots.txt的写作。
robots.txt基本介绍
robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。
当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。
另外,robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
robots.txt写作语法
首先,我们来看一个robots.txt范例:http://www.seovip.cn/robots.txt
访问以上具体地址,我们可以看到robots.txt的具体内容如下:
# Robots.txt file from http://www.seovip.cn
# All robots will spider the domain
User-agent: *
Disallow:
以上文本表达的意思是允许所有的搜索机器人访问www.seovip.cn站点下的所有文件。
具体语法分析:其中#后面文字为说明信息;User-agent:后面为搜索机器人的名称,后面如果是*,则泛指所有的搜索机器人;Disallow:后面为不允许访问的文件目录。
下面,我将列举一些robots.txt的具体用法:
允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 “/robots.txt” file
禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBot
Disallow: /
只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: Crawler
Disallow:
User-agent: *
Disallow: /
另外,我觉得有必要进行拓展说明,对robots meta进行一些介绍:
Robots META标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。
Robots META标签的写法:
Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。
INDEX 指令告诉搜索机器人抓取该页面;
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;
Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。
这样,一共有四种组合:
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>
其中
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以 限制GOOGLE是否保留网页快照。例如:
<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>
表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。
特别说明,本文章的写作参考了一些网络信息,robin只是按照自己的思路对信息进行整理。
互联网创业者因该知道的:六大创业经典理论
互联网创业有自己的游戏规则,很多时候我们可以从前人的经验总结中提高自己,以下是六大创业经典理论,虽然并不完全是互联网,不过其经验却适合所有创业者分享!
鞋厂理论:世界上有无数家鞋厂,制造着各自的鞋子,销售给各自的客户。
在网络上,当某个生意已经有人在做的时候,就想想皮鞋理论,你会发现:在大多数情况下,即使有很多人在做鞋子,也并不意味着你就不能再去做鞋子了,别人做了耐克,你可以做李宁,不行就做安踏啥的,即使不知名的杂牌也在三线城市卖的不错。
如果其他的鞋厂都在赚钱,那么你也有机会在这个市场里分一杯羹;如果其他鞋厂都在亏钱,那么你要想办法把他们亏掉的钱赚到自己手上。把成本、产品、 服务、渠道、营销都做好,你就有机会超过现有的竞争对手。赚钱的生意,往往都是已经有很多人都在做的生意。如果某种生意只有你一个人在做,也许说明你的生 意没法赚钱,所以没人看得上。
杂货店理论:很多大型的卖场或公司,比如沃尔玛、八佰伴、麦当劳等,最初都是从一家小店起家的,从小蚂蚁逐渐做到巨无霸。
在网络上,很多人相信,在没有VC的时候,公司亏钱是正常的,等某一天拿了巨额的VC,扩大规模、全国连锁,就肯定会赚钱,于是公司的核心团队把时 间精力都花在了各类投资经理身上。这时候,就该想想杂货店理论,如果你经营一家小杂货店却一直亏钱,那么,如果有人帮你做到了7-11那样的全球连锁,你 会亏得更多。
除去那些具有技术革命性的公司(比如3G、云计算、光存储啥的),在大部分情况下,一个好的公司、或者说一个好的商业模式,如果在大范围内可以赚 钱,那么缩小到一个小范围去运营,也应该是赚钱的。这样的公司,尽管前期需要少量的初始资本和时间来配置人员、软硬件,但绝不会把自己的未来寄托在虚无缥 缈的巨额投资和全球扩张上。沉浸在VC幻想里的孩子们,不如先去经营个杂货店,会比见VC学到更多东西。
户口本悖论:警察局有当地所有居民的户口档案,但是警察局能从中赚钱么?
在网络上,很多人都把“抓用户”作为唯一的追求(或者作为前几年的唯一追求),而忽略了构建真正可行的健康的盈利模式。这时候,你就该想想户口本理 论:警察局拥有那么多用户的详细资料,详细到血型、电话和住址门牌号,你的网站能比警察局更牛逼么?如果你以为靠那点用户的email就能赚钱的话,警察 局早就可以去纳斯达克了。
当然,我不否认一定基数的用户的确是赚钱的重要条件之一,但是光养用户、不思现金流是没有意义的。有很多手持几百万注册用户的网站还看不到任何赚钱 的希望,而有些才几万人的小站却每天有稳健的现金入账。所以,如果赚不到钱的话,建议别再到处炫耀有xx百万用户了,搞那么多用户还不赚钱,只能证明两个 字:无能。
沸水理论:把水煮沸后,看上去热气腾腾,但水的总量不会增加,而且需要供热成本。
在网络上,很多人不择手段地去追求用户的“活跃度”,却不考虑活跃度到底能带来什么收益。活跃度本质上有两种:跟业务相关的活跃度,比如经常上淘宝 看流行商品的活跃用户,一般来说会增加购买的几率;另一种则是与业务无关的活跃度,假设淘宝搞了个跟购物无关的免费网游,结果每天有几百万人上线来玩(产 品经理可以报上很漂亮的activation rate和retention rate),但这些人单纯迷恋网游的人转去淘宝购物的机会有多大呢?由网游带来的收益是否能超过开发和维护网游服务器的成本呢?没人知道。
这时候想想一桶沸水,为了维持一个看上去热腾腾的活跃度,你需要不断添柴、加火,这些供暖成本很高的,而由此产生的热气却无法增加额外的水量,那么 还要煮沸它做什么呢。特蕾莎修女说,一个人的逝去是个悲剧,而一群人的逝去只是一个数字。 在网络上,当我们看到一群人的活跃是个漂亮数字的时候,应该去看看每个人活跃的背后到底意味着什么价值。
热水器理论:有很多人愿意花钱购买热水器,也有很多人愿意花钱维修出故障的热水器。
在网络上,很多人相信,如果一个网络产品不是人们的必需品,那么就很难收费。的确,网络上的用户已经习惯了免费的生活,正如人们习惯了免费的空气、 免费的马路一样。这个时候你就该想想热水器理论,热水器也不是生活必需品,人们完全可以洗免费的冷水澡,甚至不洗澡,为啥家家都有一台动辄上千元的热水器 呢?
很简单,因为人类有意愿追求高质量的生活体验(包括但不限于洗澡),而热水器没有更廉价的替代品。如果你的网络产品或服务能够给人们带来真正高质量的生活体验,同时又没有廉价的替代品,那么一样有人愿意付钱。比如,我很愿意为Gmail的手机客户端付钱,很愿意为Pandora的在线音乐付钱,很愿意为Yeeyan的高质量译文付钱,当然也愿意为Tucia的设计服务付钱。跟我一样的人还有很多,请不要对互联网绝望。
油条铺现象:如果你去跟街上卖油条、卖煎饼的师傅聊一聊,你会发现他们每月的收入很稳定,有的甚至可以月入几万。
网上总说创业99%会失败,什么九死一生,什么倾家荡产都用来形容创业者。这时候,想想卖油条煎饼的创业者,人家在街边随便摆个三轮车,就能养活一 家人了。再去看看大街上的餐厅、奶茶铺、手机配件店、杂货店、床上用品店。。。。为什么这些创业者大部分都活得好好的?而号称IT创业精英的大学生反而一 分钱都赚不到?
如果把“能够养活一家人”作为最低成功标准的话,那么大街上的普通人的创业成功率超过80%,而我们还用“创业九死一生、失败也正常”来安慰自己的无能,真他妈窝囊!
如何采集变原创
试想下如果一篇文章20%-30%的内容都不一样的话那就不是采集了,只能说相似,这样就大大降低了被K几率,一般的纯采集的站存活2-3个月80%会被K,经过这样修改做出来的站可以把被K几率降低到20%以下”此方法跟论策下面所谈的有所不同:
方法一:拆分法
把原有连续的文章,平均的截取成为2段3段或是更多。
好处:降低相似度、提高访问者浏览的速度、增加页面访问量
缺点:文章无法连续浏览,原有的一次性浏览变得繁琐,同时对Title标题的优化也有一定的不利,因为会有重复。不过数量较小的情况下不会有什么大碍。
方法二:跟随法
把每一个段落的结尾都增加一段话,可以是有情提示,小调查,或是其他文章的推荐。
好处:进一步降低相似度,给可以更多讯息,提供更多使用的功能。例如“回到最上面”
缺点:使用不当将降低用户体验,如果使用JAVASCEIPT等作有可能影响页面加载速度,干扰客户浏览主线。
方法三:标签法
在特定的关键字后增加友情注释。例如:我们所倡导的SEO(SEO相关信息)思想是。..。..
好处:增加用户体验,让客户可以了解更多并不熟悉的专业名词,从而更好理解文章含义。 还可以自然的重复关键字,增加关键字密度。
缺点:如果使用过多,会造成页面信息繁乱,降低用户体验。增加页面体积,降低加载速度。干扰原有关键词布局和密度。
方法四:隐身法
将一些没有实际用处的词使用图片代替,经过优化的GIF图片只有十几个字节,将文章中出现的部分特定字或词进行隐身,也可以很好的达到降低页面相似度的效果。
优点:不干扰关键词布局、不干扰用户体验、不影响浏览和加载速度、有效防止被采集。
缺点:仅仅增加少许加载时间,但几乎可以省略不计。
方法五:规律性
如何让采集回来的文章尽快让搜索引擎收录呢?透过网站日志,我们可以看到蜘蛛爬行次数在某个时间点上 都有一个高峰,根据论策的观察,在上升期添加文章,在到达顶峰之后,快照就会被放出来。这样的高峰在曲线上不止一个,我们添加文章的时候,最好固定在某一 个高峰前,这样,规律性强,蜘蛛也会有规律的来抓取。
方法六:版权法
在每篇文章的末尾加上免责声明:本文系转载自网络,如有侵犯,请联系我们立即删除,另:本文仅代表作者个人观点,与站长网无关。其原创性以及文 中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相 关内容。
方法七:内页更新法
1. 内页要有很好的更新频率,首先要你该内页的目录主页权重要高。其次要看该内页目录收录多还是少,权重越高,排名就越好,更新频率也好。
2. 内页的更新可以有本周热门、推荐内容、相关内容、最新主题等等,还有留言回复 这些都是更新内页的好方法。
如果以上七种方法相互配合使用可以极大地降低页面相似度,提高页面在搜索引擎中的诚信度。
搜索引擎的青睐,各项要害词都处于靠前的位置。经常更新并有原创的网站,才是搜索引擎的最爱,而总体上来说,想要排名好,更新是要害。
其实搜索引擎优化,不仅仅是这些内容,但小的技巧上一定要注重,玩搜索引擎就是个细致活,所以不仅要会做,更要会思考,举一反三才能有快速的提高和进步。
垃圾站全站采集也能被收录
为大家谈谈我的采集方法:
1 采集设置中把目标的地址全部过滤,换成自己的地址。
2 采集中很少人不采集时间来源其实这个很重要,采集的时候最好也把文章发表时间采集出来。
3 采集只需要每天采集1页的目标就行了 ,不需要全部采集过来。那反而影响自己站的收录。
4 采集之后里面添加原创文章那是必须的,我的方法是:我做的DNF站,现在出了叫DNF代码的东西,因为这个DNF代码每天都有不同的,我就依据这个关键字 制作我的原创文章。比如今天是2月15日。我在自己站里发表了一篇《2月18日最新DNF代码》因为今天没到18日按照惯例18日代码不会出现,但是我却 让它出现了所以在百度眼里《18日DNF代码》就成了原创文章,然后每天添加一篇这样的文章每天访问量就会大大增加。
5 采集之后修改一些标题和内容也是必须的工作之一,我这个人很懒通常只修改下标题也就OK了!(大家千万别学我,勤奋才会出流量)
6 采集完之后的工作也得做好,比如整加外链接等等,在这里我就不说了。
我的采集站做了一个星期了吧!每天都有从百度 谷歌过来的流量。
采集站最常出现的SEO症状
批量采集,复制内容,一向是搜索最为痛恨的行为。虽然前段时间Google、Yahoo和Msn宣布合作推行判断复制网页的标准,但那也是至少一两年后的 事情。目前依然是采集横行,甚至很多地方都流传连新浪等大门户也都在进行着采集行为。的确,采集不仅可以大大的方便网站的管理,增加网站的内容,同时增加 网站的收录和流量。
那么,采集后的网页和原创网页网站优化服务,搜索如何来判断?一个是权重,一个是索引时间。如果提高这两个因素,让自己的页面获得高排名,本文就暂时不在描述。但如何不让搜索惩罚你站,如何让搜索多收录你的站?下面我把一些采集站的SEO搜索引擎优化症状和过程整理出来:
我经营的网站比较多,特别是一些小说网和游戏网,主要来做一些SEO搜索引擎优化实验。当然,这就是典型的采集站,俗称复制站。
首先,用网上流传的杰奇程序,框架不去修改,或者修改一些,内容读取也差不多同样规则,进行适当优化。
那么,开始1个月之内,收录会不断增加,在适当宣传下,收录几千几万是正常现象。主关键词也可以获得不错的排名。一个月左右,就处于危险期。大部分的 网站,都会被K得剩下几十或者只剩下主页,快照退回半个月前。那么,可以说,这个小说站已经废了,或者不值得继续去经营。追寻原因,就是页面重复。
而要预防这类惩罚的出现,很简单,就是原创,与众不同。从程序,功能,内容,框架入手,全部与众不同,那么,就算同样的文章,你的收录一样多。当然,这句话对些站长是废话,因为他们做不到这些。那也没关系,我们同样有后招。
那就是内容简单,优化独特。对于采集页面来说,搜索非常敏感,所以对待这类页面的优化,一定要小心小心再小心,否则就是被K得剩下守页的结局。建议标 题简短,和别人无重复,例如“某某小说,最新章节,TXT章节”这类的标题,那是找死,被惩罚的机率非常之大,你内容程序框架重复了,标题还重复,那和洗 净脖子送到刀上没什么区别。
第二个就是用户体验,也就是增加PV,在收录多的情况下,把PV增加高些,在搜索中会增加很多权重。避免被K,毕竟并不是所有的复制网都会被惩罚,总会有漏网之小鱼。
第三,就是增加同行友情链接,众口烁金,谎言说多了,就是真理。同样,我们通过采集站,获得了一个高起点。如果有众多同行的支持,趁势而立,实为上策![CuteSEO网络营销管理顾问]