建站经验-站三界导航

建设网站外链需要注意的相关要点
网站外链建设是网站优化的一项重要内容，是网站获得快速排名提升的一种途径。但是在交换友情链接的过程中，有很多的禁忌是需要我们需要注意的，站长之家就以下几点友链交换需要注意的事项进行阐述：1、不要和不正当网站交换友情链接建网站过程中做友链千万要注意的是，对于黑客网站、灰色行业网站，或者是曾经做过违规内容的网站，这些都不要和他们做友链。这些网站一旦被挂马就会影响到自己的网站。2、不要和降权或被k网站交换友情链接对方网站降权是会对自己网站造成或多或少的影响的，可以通过site对方域名查看首页是否在搜索引擎第一名和结合其他的情况来判断。可以利用站长工具来查询对方网站近期的收录情况，有没有出现大幅度的变动，一般都是减少收录或者直接收录为0，这样的网站说明曾经是被K过的，一般被K过的网站都需要大约3个月的时间来恢复排名和权重，所以，近期此网站的排名和权重估计恢复的机率很少。3、不要短时间发布大量的外链发布网站的外链要循序渐进，不能暴增暴减，短时间内大量发布外链会被搜索引擎判定为违规操作，过度优化，网站会面临降权更甚会被k站。4、不要和同一个ip的网站交换链接同一个ip的网站交换链接会把这些网站交叉串联起来，只要其中有一个网站被搜索引擎惩罚，就很可能会牵扯到自己的网站。5、不要和没有快照的域名交换链接看一个站的百度权重一般看快照更新的速度，可以先用domain：对方域名和site：对方域名，如果domain无结果site也无结果说明并非被K，反之，则为被K，那就不要交换友链了。6、不要波动太大譬如对方网站今天收录一万条明天零条，这样就会被搜索引擎处罚，连累到自己的网站。7、不要和反链太多的平台交换链接我们自己的网站当然是希望网站反链越多越好，看对方的网站，如果反链数量多，百度不会计算分值给我们的网站。8、不要和没有收录的网站交换链接网站没有收录有两个原因，一是新站，一个是被百度惩罚过，这些都对网站权重和排名的提升没有用处。9、不能购买大量的垃圾外链链接买卖会导致一个网站悬挂很多的友情链接，这会被搜索引擎识别为作弊，而且这些链接存在不稳定性，下线或降权都会牵连到你的网站。10、对方的导出链接不能太多对方网站的友链应该低于30个，如果对方网站存在有太多友链，那么分给自己网站的权重也相对于少，对权重提升没有太大作用。
- 建站经验
- 160阅读
- 2022-04-28

构建跨浏览器兼容网站的八个基本技巧
一旦你花时间了解一下Web浏览器的历史并了解它们的工作原理，构建和测试跨浏览器兼容网站的必要性就显而易见了。但是，了解跨浏览器工作的Web应用程序的重要性是一回事，而为其开发又是另一回事。虽然几乎不可能让每个浏览器的设计看起来都完全相同，但有几种方法可以确保你提供一致的用户体验。有一些技巧可以让你的网站交叉兼容。1.保持代码简单。在编码时考虑质量而不是数量。不要将十行代码专门用于只需要三行代码的功能。简单的代码不仅对跨浏览器更友好，而且在需要调试或调整兼容性时也更易于维护。2.使用框架。Foundation和Bootstrap等CSS框架将为你提供样式代码，让你更轻松地进行交叉兼容性。如果你花时间熟悉某些功能，构建响应式Web应用程序将变得更快、更容易。这些还将帮助你使应用程序在移动浏览器中的外观和行为正确无误。3.定义有效的Doctype。Doctype是你代码中的第一行，它描述了将在你的应用程序中使用的HTML。因为不同的浏览器有不同的标准和规则，所以你需要定义Doctype，否则渲染引擎基本上会为你猜测。当然，这可能会导致你想要避免的错误和不一致。4.CSS重置。每个浏览器都遵循不同的默认CSS规则。这就是为什么你使用CSS重置样式表来确保你的浏览器遵循相同的基本规则并保持一致。你希望将其中一个添加为第一个样式表以进行重置，除非你使用已经拥有的框架。5.验证。验证你的HTML和CSS以防止出现问题是个好主意。使用W3CHTMLValidator和CSSValidator来确保你的代码没有错误，如果没有则修复它。6.条件注释。条件注释允许你链接不同浏览器的样式表，这在涉及InternetExplorer常见的设计挑战时特别有用。7.为差异做好准备。同样，几乎不可能有一个在每个浏览器上看起来都相同的设计，除非它非常基本。无论你遵循什么规则，形式和排版等细节都可能会有所不同。你的主要关注点不应该是让设计在每个浏览器上看起来都相同。相反，你应该确保它看起来可以接受并且可以使用，而不会包含不合适的元素或阻止某人访问某些功能的元素。8.不要跳过跨浏览器测试。在开发时记住这些技巧是不够的。尽管你试图避免它，但很容易意外地编写在一个浏览器中不起作用的东西。这就是为什么你需要在交付前检查该站点是否在不同浏览器上实际运行的原因。使用CrossBrowserTesting之类的工具，你可以在1,500多个浏览器中执行此操作，因此你永远不必想知道用户从不同的机器访问你的页面时看到的内容。原文链接：https://www.toutiao.com/a7047750322659836452/
- 建站经验
- 146阅读
- 2022-04-28

手把手教你搭建自己的博客网站
博主为了写一些深入分析的长文，并对知识进行分类总结，创建了一个个人博客网站，本文教大家如何创建自己的博客网站。博主的小破站：http://www.linuxer.vip1、服务器先购买一个阿里云服务器，就是一台云主机，这个主机是Linux系统，自带安装了Wordpress镜像，Wordpress是博客专用。博主买的服务器如下：当时是白嫖阿里云的活动，买了以后返现。现在【轻量应用服务器】原价是1600多，大家可以不买这个服务器，可以买【云服务器ECS】，这一款也可以搭建博客网站，很便宜，链接如下：https://www.aliyun.com/product/ecs?spm=5176.19720258.J_8058803260.30.5f982c4am5Os3G2、域名域名就是别人访问你的服务器的地址，不购买域名只能通过IP访问，做了域名映射以后，别人可以通过域名访问。在阿里云平台可以购买域名，当然其他平台也可以，购买链接如下，不同后缀不同名字的域名，价钱不一样：https://wanwang.aliyun.com/?spm=5176.19720258.J_8058803260.30.5f982c4alhlFw03、网站备案购买了服务器以后，就可以写文章发布，但是你买的域名还不能用，所有的域名要到工信部备案，需要10-15个工作日，在备案完成之前，你的网站还是只能通过IP地址访问。备案链接：https://beian.aliyun.com/?spm=a2cmq.17630022.J_8058803260.3.7ab879feyN2yUE4、域名解析DNS当域名备案好以后，需要把域名和你自己的IP地址关联起来，这样别人访问你的网站，输入域名后，才能解析到你的IP地址，才能访问到你，链接如下：https://wanwang.aliyun.com/domain/dns?spm=5176.19720258.J_8058803260.56.18542c4aaVKYNI博主的示例：5、服务器后台你在第一步购买了服务器以后，是有一个服务器后台的，后台是网页版，如下：但是因为我们是内置WordPress镜像，登录该镜像的后台需要你按照指示先去服务器内获取WordPress密码，然后在网页中输入服务器地址，就可以使用admin和密码登录WordPress镜像。可以看到这里是有提示的，在系统中获取到密码以后，在网页中输入管理员登陆地址，就可以登录到WordPress镜像的后台，在WordPress镜像的后台中书写自己的文章，并发布。6、WordPressWordPress有很多插件和主题可以使用，博主安装的插件如下：1、Akismet反垃圾评论2、Elementor3、GoogleAnalyticsforWordPressbyMonsterInsights4、InsertHeadersandFooters5、LimitLoginAttemptsReloaded6、PostViewsCounter7、RankMathSEO8、Smush9、Wordfence安全10、WPGithuberMD11、你好多莉12、多合一SEO集13、经典编辑器14、超级缓存可参考文章：https://developer.aliyun.com/article/702604https://zhuanlan.zhihu.com/p/34314017https://www.cnblogs.com/qianguyihao/p/4965163.htmlhttps://blog.csdn.net/zcl369369/article/details/40949971原文链接：https://mp.weixin.qq.com/s/6vl7K-3_a9UH780ps0wtoA
- 建站经验
- 144阅读
- 2022-04-28

别迷茫了！给B端新手设计师的 4 点职业建议
发现很多新人加入到B端企业后，通常会比较迷茫，怀疑自己究竟适不适合B端设计这个职业，也会来咨询我，希望可以获得一些答案。我回忆自己在几年前，第一次加入到B端企业后，同样会有很多困惑与迷茫。现如今回过头，想结合自己的经验，来分享一下我的看法。改变固有的思维方式每个人，在处理自己熟悉的事物时，往往都会有「思维定势」。我们在设计页面时，会去考虑用户的思维定势，而在处理设计问题时，也是同样的道理。在与许多C端转B端的资深设计师交流过程中会发现，他们在去处理问题时，仿佛还是按照之前的思维定势。也就导致在工作过程当中遇到诸多麻烦，比如：领导抱怨其经验不够，但他又是一位从事多年的设计师在处理设计需求时，只会在乎“表面问题”在团队中得不到重用，名副其实的组件设计师究其原因是在C端时代，设计师的口中都是围绕着用户进行展开;而到了B端时代，我们聊的就不再是用户，而更多是营收，是流程、是业务因此在去处理B端需求时，设计风格就一个“表面工程”，并不是说它不重要，而更多是为了服务产品真正的“灵魂”，回过头去看作品集，我们要求的就不是：你作品集的排版究竟有多好、选择了什么好看的字体、用了哪些亮眼的配色，而更多是从你的作品集当中，看出你的思考，通过你在交互流程上的调整，产品得到哪些优化。跳出自己的舒适圈在自己的舒适圈，可以理解为“安逸”。安逸这个词，在我一个成都人面前，简直“不值一提”，它既能够表达你对于当前状态的一种赞叹，同时也是对别人的一种羡慕。因为在说安逸时，我们往往只会说别人过得多么安逸。很多人会认为，跳出自己的舒适圈不就是内卷么?但是我更愿意把它理解成一种学习态度，因为刚接触到的B端事物，一定是全新的，打破你之前认知的东西。比如聊低代码产品，我们肯定会去说对象、布局、配置表单。而这些东西，稍微延展都是非常多的内容，如果你从事多年B端设计过后，你会发现你越来越像一个产品经理，只是因为大家站的立场会有所不同，所产出的内容会存在些许差异。当你产生焦虑的时候，就特别想要跳出舒适圈。我自己也是一样，之前上班工作时，每天早上10点到岗，我却在6点50的天府三街沉浸学习，这也能够有充足的时间去做工作以外的事情。选择更有潜力的行业在B端产品当中，行业选择是非常重要的一件事。因为想在这一行业深入发展，一定是需要陪伴企业走过2-3年，并且在后续的跳槽过程中，行业属性是你非常重要的标签。可以看到各类招聘信息当中都明确指出行业的重要性。因此选择一个更有潜力的行业，能够在后续的职业生涯当中，加分不少。专注深耕某一领域看似与上一条重复，但是想要给大家讲得关注点会有所不同这里的重点是深耕，因为在与一些工作2-3年的B端交互设计师的接触过程中，会发现他们对于自身业务仿佛并不了解、甚至有些陌生。而深耕某一领域，也就意味着你在一个行业有着专家级的水平。而后续的跳槽，也可以通过你自身的实力，快速上手该行业的对应业务而深耕虽然会在职业发展的后期带来诸多困境，但是不得不说在B端市场的前期，能够教会你很多分析B端问题的道理总结B端设计与C端不同，业务形态上就会存在巨大差异。同时在工作的态度上，不建议大家过于浮躁，因为B端需要较长的研发过程，导致需要你能够在某一个行业深耕，因此在职业发展上，希望能够做出谨慎选择!站三界导航：https://www.zhansanjie.com
- 建站经验
- 133阅读
- 2022-04-28

网站标题中的特殊符号效果是怎么做的？对seo优化有影响吗？
不知道大家平常有没有见到过这种网站标题：就是在网站标题中突然出现了一个特殊符号，这个符号的形状很夸张，高度也远远超出了正常字体。猛地看上去比较别致，很容易吸引人眼球。那么这种符号是怎么做上去的呢?其实很简单，直接在标题里边添加这个符号就可以了。比如上图的符号就是这个：⎛⎝≥⏝⏝≤⎠⎞你只需要把这个符号复制一下，然后放在你的网站标题里即可。当然，也可以直接放到文章标题里，当这篇文章被百度收录后，别人如果搜索到你这篇文章，就可以看到这个特殊的标志。这种特殊符号对网站本身来说没有什么作用，但是可以起到吸引眼球的目的，一定程度上可以增加一点点击量。但是科牛认真研究了下发现，这种符号也是有弊端的。首先，我们需要了解下搜索引擎对各种特殊符号的态度。常用的特殊符号有，逗号“,”，连字符“-”，下划线“_”，短竖线“|”，顿号“、”需要注意的是，我们平常在标题里边使用的这些符号都是在英文输入法状态下的。因为搜索引擎对英文状态下的特殊符号可以明显区分，但是对中文状态下的特殊符号有时候是无法区分的。比如，“科牛,网站制作”如果“科牛”和“网站制作”这两个词汇中间的逗号是英文状态下输入的，那么搜索引擎会直接把他们分词为科牛和网站制作两个词。但是，如果这两个词汇中间的逗号是中文输入法，那么搜索引擎就有可能会把“科牛，网站制作”这个整体作为一个词汇来处理，这对关键词seo优化是不利的，虽然现在的中文搜索引擎已经非常智能了，可以通过算法去识别，但是毕竟多了一层计算，不如直接使用英文来的更好。特别是网站标题里的关键词分割，标点符号使用不当会直接影响到网站排名。当然，关于这方面的规则，百度并没有书面声明，都是通过长期测试总结出来的一点经验。那么再回头说下这个特殊符号，⎛⎝≥⏝⏝≤⎠⎞科牛查了下，这个⎛，以及⎝，这两个符号在英文输入法里是没有的，在搜狗输入法的特殊符号里也是没有的，它貌似是中文五笔输入法里边的“pie”和“na”，因为我不会五笔，具体怎么打出来我也不太清楚。但是，结果是明显的，这两个都是中文符号，如果用在标题里边，搜索引擎是会把他们以及紧邻他们的汉字当做一个词汇的，这是不利于seo优化的。网络上最开始使用这个符号，其实是从快排开始的，因为快排的网站寿命普遍较短，添加这个符号可以在短期内增加一些点击量。之后，有些不明所以的站长感觉好玩，就也添加到了自己的网站上。。。综上，科牛觉得，如果是新站的话千万不要这样做，如果是老站的话，已经有了一定的权重，网站比较稳定了，可以考虑加上一两个类似的符号，比如下边这个网站，它只用了两个字符，乍看上去像个牛头，效果感觉还可以。
- 建站经验
- 146阅读
- 2022-04-28

自己做网站如何选择域名
自己做网站需要准备：网站域名、网站程序、虚拟主机/服务器域名是网站的基本组成部分。通俗的说，域名就相当于一个家庭的门牌号码，别人通过这个号码可以很容易的找到你。如何选择网站域名：1、如果网站关键词是中文的，则排名与域名的关系可以忽略不计。拼音的域名并不会对排名产生明显优势。2、如果网站关键词是英文的，则域名里包含关键词非常重要。对于做英文站的同学，URL里包含关键词是一切优化的关键。3、对于要做品牌网站的同学，好记的域名是选择的关键。推荐比较安全的域名注册地址：国内www.aliyun.com国外www.godaddy.com，不管是国内或国外注册的域名，对SEO均无影响。网站程序推荐：1、建站软件365建站器让建站和seo变得简单2、个人博客Wordpress：PHP的程序，比较强大;Zblog：asp的程序，比较简单。3、门户网站帝国cms：他们网站有较多门户案例;Kingcms：SEO友好性中等。4、企业网站365建站系统：中文企业站，比较简单，融入所有SEO因素，非常适合不会建站的同学;Wordpress：英文企业站;www.5ucms.comasp：如有asp的空间，则推荐采用这个。5、论坛Discuz、phpwind6、网店shopex7、外贸网站Zencart、magento：网上商城、零售B2C;wordpress：工厂批发B2B8、B2B网站destoon虚拟主机：1、选择注意点：咨询空间商，是否支持URL重写。另外可以试用几天观察速度，不慢即可。2、练习建站推荐：用来练习建站可以在淘宝上找一个按月收费的比较便宜的空间，要求php、支持URL静态化即可(淘宝搜索“wordpress空间”)。3、长久站推荐：阿里云、腾讯云、西部数码对比购买即可。刚开始购买最小的空间+数据库，之后数据多了可以再升级。4、国外站推荐：www.godaddy.com、www.bluehost.com、www.dreamhost.com国外站存在一个问题：不用备案所以可能同ip上有非法网站导致网站受牵连而被k，所以如果一定要国外的空间，又不希望被其他网站牵连，可以考虑买独立IP。现在大多数企业都会通过建设自己的网站来提高自己的专业性和知名度，那么大家都知道建站的第一步就是域名，接下来小编就教大家如何选择一盒适合自己的域名。1、符合企业名称和形象域名注册要符合企业名称和形象，因为这是企业进行网络营销的前提。一个域名具有唯一性，一旦注册成功，其他企业将无法注册相同的域名。因此，企业在域名注册时候，一定要考虑企业名称和标识，网站域名尽量与品牌名称相关,也可以加区域或者数字;。2、简洁性域名注册要注重简洁性，一个好的域名不能过于冗长，避免过长字符，导致用户无法轻松记住，方便用户记住你的域名就应该简化你的域名不应太长,10字母以内最好。很多企业在注册域名的时候，往往忽视简洁性，导致注册的域名繁琐。用户打开网站，根本无法记住域名，从而降低用户访问网站的优质体验。3、是否考虑国际性企业注册域名还应该考虑到国际性，是否存在国际用户。优质的域名，和企业网络形象有着紧密的联系。如果企业域名不能被潜在用户机制，那对于公司来说是损失。因此，企业注册域名的时候，一定要了解企业是否涉及国际用户。选择目前最流行型的域名后缀。首选com,其次cn,再次net;
- 建站经验
- 152阅读
- 2022-04-28

如何加速 Web 应用程序并提高网站性能
网站性能的优化是一件大事。它涉及多个方面需要照顾，其中许多取决于网站本身、其复杂性和元素。但是，还有一些适用于任何站点的常用优化方法。集成CDN内容交付网络(又名CDN)是一个非常棒的工具，可以集成到你的网站中，因为它可以大大加快你的内容交付速度。因为它是一个分布式服务器网络，所以CDN会找到离用户最近的服务器并部署它来交付内容。通过这种方式，内容会走得更短，并提供更好的用户体验。许多CDN还具有许多其他可提高网站性能的功能：图像优化、缩小CSS、代码重组。压缩文件每个文件都需要一些时间来加载。问题是，文件越大，加载的时间就越长。结果，该网站以极其缓慢的方式加载并惹恼了用户。解决大体积文件的问题，压缩它们并享受更快的性能!对于文件压缩，建议使用Gzip工具，这是最受信任的工具之一。Gzip声称可以将文件大小减少多达70%，并显着提高性能。启用Gzip的方法有很多种，具体取决于你的站点。例如，你可以在.htaccess文件中启用Gzip或简单地使用插件。使用延迟加载每个网站都包含一定数量的媒体文件(即图像、视频、音频文件)，每个元素的加载需要相当长的时间。延迟加载设计模式使媒体文件仅在进入用户视点时才加载。这意味着，当用户打开页面时，它不会立即加载所有媒体文件，而只会加载页面顶部的媒体文件。而且，当用户向下滚动时，页面将加载更多文件。这种技术极大地节省了带宽，同时提供了无缝的用户体验。延迟加载还摆脱了不必要的代码执行并减少了内存使用。你还可以将代码分成不同的包，以便不同的页面仅包含代码块。这样，浏览器将只加载用户所在的那些代码。缩小CSS和JavaScript当你的站点下载JavaScript或CSS文件时，会向服务器发送一个HTTP请求。发送的请求越多，性能就越慢。为了解决这个问题，你可以合并和缩小文件以减少HTTP请求的数量，从而提高性能。缩小包括消除空格、不必要的代码行或换行符。要执行此过程，请使用WPRocket或WillPeavy等可用插件之一。优化数据库数据库优化可能是你网站性能的瓶颈。虽然有很多方面需要关注，但最常见的是：MySQL查询优化：使用EverSQL查询优化器等工具来微调MySQL查询并获得有用的建议，索引：该方法允许更快的行选择和排序，内存容量：如果内存不足，会降低性能，因此你可能需要寻找更强大的托管解决方案。请注意，数据库优化也取决于你的站点。对于某些网站(即电子商务平台)，有一些独特的问题需要处理，因此你需要先进行审核，以确定所有需要优化的问题区域。摆脱阻塞的JavaScript许多网站最常见的问题之一是阻止渲染的JavaScript文件。要解决此问题，你可以执行以下操作：在HTML文档中内联外部锁定脚本使用特殊插件(即W3TotalCache)使用async属性使JavaScript文件异步启用缓存每次用户登陆页面时，浏览器都会加载其内容-每次出现新查询时都会这样做。现在，你能想象每天有多少用户访问你的网站以及浏览器必须加载页面内容的次数吗?为了防止站点为返回的用户加载相同的内容并节省一些加载时间，请启用浏览器缓存。至于新用户，网站仍会从头开始加载内容，因为新用户的缓存是空的。尽管如此，完整的浏览器缓存可以将站点速度从2.6毫秒提高到1(甚至0.9)，因此强烈建议使用它。快速工具：盖茨比Gatsby是一个静态站点生成器。该框架使用初步加载：当用户打开主页时，浏览器在后台模式下加载显示链接到主页的站点其他页面所需的数据。使用Gatsby构建的网站是一个React应用程序，因此它只加载有关页面之间差异的数据，而不是完整的页面。在页面之间的转换过程中，虚拟DOM被更新。通过这种方式，用户可以享受高速加载和流畅的网站性能。上述性能优化方法是处理网站慢问题的最常用方法。但是，由于每个网站和Web应用程序都是独一无二的，因此你需要首先进行性能审核，以准确识别你的网站存在的问题并提出解决问题的正确方法。
- 建站经验
- 157阅读
- 2022-04-28

一招制敌，搞定前端系统设计和优化题
最近接触了不少面试题目，有这么一类常见的题目，没有标准答案，上下限差距很大，第一次碰到没有准备的话，回答起来总会比较纠结。具体的题目有性能优化，提升代码质量，做埋点系统，优化webpack等，这里我把他们统称为系统设计和优化题。在这里我尝试找一下应对这些问题的套路，让大家可以在工作和面试中找到感觉，顺利过关。下面我就同时写题目和我自己的答案，希望大家能在阅读的过程中找到一些规律。具体题目如何做性能优化？问题的关键是性能，那么，性能指的是什么？页面加载的快慢和页面是否流畅。那么用什么指标来衡量呢?页面加载时长和帧率怎么计算这些指标呢?加载时长可以使用performance.timing,API上报，onload等事件。而帧率可以使用raf来计算。那么我们要怎么做性能优化呢?针对用户访问的全流程，每一步进行优化。如dns解析，tcp链接，渲染页面等。详情可以查看我的文章。如何提升代码质量?同样我们要先想以下的问题什么是代码质量？代码质量有哪些指标（代码性能、代码的缺陷数量）？怎么计算指标？怎么提升代码质量？从研发的流程着手。需求评审、代码初始化、写代码（eslint）、提交代码(gitcommit钩子)、测试代码、发布代码（规则拦截）、数据监控如何进行效率提升怎么衡量效率？人日？怎么提升效率?跟上面的提升代码质量的阶段比较接近，不重复讲了。怎么设计埋点系统关键的问题是数据，因此我们要从数据着手，了解我们要上报哪些数据（性能/用户行为/错误），怎么上报数据（gif，api），怎么处理数据（日志清洗，归类，存储），怎么查看数据（可视化，权限系统），怎么利用数据（生成报表，报警监控）怎么做搭建系统关键的元素是页面。因此我们要围绕页面的生产，页面的配置，页面的管理，页面的渲染等来进行讨论怎么做客户端离线资源系统？关键问题是资源。因为我们要解答发放什么资源，什么时候发放，怎么发放，怎么更新、删除资源，怎么使用资源，资源的优先级、有效期等问题怎么优化webpackwebpack的优化可以分为缩小体积和减少打包时间两个方向。我们可以从webpack打包的流程为切入点进行分析。初始化参数阶段、加载插件阶段、确定入口阶段、编译阶段、完成编译、输出资源、写入文件尾声不知道大家找到一些规律了吗？下面是我的思路。找到问题的关键点，找到如何衡量关键点的方法，从系统运行的全流程进行分析，针对每个流程进行分别优化。希望大家可以有一些收获。
- 建站经验
- 144阅读
- 2022-04-28

常见的HTTP状态码(200/301/404/500)
当浏览者访问一个网页时，浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前，此网页所在的服务器会返回一个包含HTTP状态码的信息头(serverheader)用以响应浏览器的请求。HTTP状态码的英文为HTTPStatusCode。下面是常见的HTTP状态码：200-请求成功301-资源(网页等)被永久转移到其它URL404-请求的资源(网页等)不存在500-内部服务器错误同样道理，当搜索引擎的Robot(机器人)或Crawler(爬行器)抓取你的网页时，服务器也会返回HTTP状态码相应请求。此HTTP状态码提供关于请求状态的信息，告诉访问的浏览器、搜索引擎机器人：baiduspider、Googlebot等关于你的网站和请求的网页的信息。做SEO时，我们经常会在日志上看到类似这样的代码：61.135.166.232--[31/Dec/2007:02:30:11+0800]"GET/56549.HTMLHTTP/1.1"20010968"-""Baiduspider+(+http://www.baidu.com/search/spider.htm)"66.249.70.172--[31/Dec/2007:03:36:10+0800]"GET/16568.htmlHTTP/1.1"20018395"-""Mozilla/5.0(compatible;Googlebot/2.1;+http://www.google.com/bot.html)"这里面需要知道的，就是那个奇怪的数字“200”(另外那个数字表示抓取的文件大小)。“200”就是HTTP状态码。HTTP状态码共分为5种类型：HTTP状态码分类分类分类描述1**信息，服务器收到请求，需要请求者继续执行操作2**成功，操作被成功接收并处理3**重定向，需要进一步的操作以完成请求4**客户端错误，请求包含语法错误或无法完成请求5**服务器错误，服务器在处理请求的过程中发生了错误HTTP状态码列表详解：状态码含义100客户端应当继续发送请求。这个临时响应是用来通知客户端它的部分请求已经被服务器接收，且仍未被拒绝。客户端应当继续发送请求的剩余部分，或者如果请求已经完成，忽略这个响应。服务器必须在请求完成后向客户端发送一个最终响应。101服务器已经理解了客户端的请求，并将通过Upgrade消息头通知客户端采用不同的协议来完成这个请求。在发送完这个响应最后的空行后，服务器将会切换到在Upgrade消息头中定义的那些协议。　　只有在切换新的协议更有好处的时候才应该采取类似措施。例如，切换到新的HTTP版本比旧版本更有优势，或者切换到一个实时且同步的协议以传送利用此类特性的资源。102由WebDAV（RFC2518）扩展的状态码，代表处理将被继续执行。200请求已成功，请求所希望的响应头或数据体将随此响应返回。201请求已经被实现，而且有一个新的资源已经依据请求的需要而建立，且其URI已经随Location头信息返回。假如需要的资源无法及时建立的话，应当返回'202Accepted'。202服务器已接受请求，但尚未处理。正如它可能被拒绝一样，最终该请求可能会也可能不会被执行。在异步操作的场合下，没有比发送这个状态码更方便的做法了。　　返回202状态码的响应的目的是允许服务器接受其他过程的请求（例如某个每天只执行一次的基于批处理的操作），而不必让客户端一直保持与服务器的连接直到批处理操作全部完成。在接受请求处理并返回202状态码的响应应当在返回的实体中包含一些指示处理当前状态的信息，以及指向处理状态监视器或状态预测的指针，以便用户能够估计操作是否已经完成。203服务器已成功处理了请求，但返回的实体头部元信息不是在原始服务器上有效的确定集合，而是来自本地或者第三方的拷贝。当前的信息可能是原始版本的子集或者超集。例如，包含资源的元数据可能导致原始服务器知道元信息的超级。使用此状态码不是必须的，而且只有在响应不使用此状态码便会返回200OK的情况下才是合适的。204服务器成功处理了请求，但不需要返回任何实体内容，并且希望返回更新了的元信息。响应可能通过实体头部的形式，返回新的或更新后的元信息。如果存在这些头部信息，则应当与所请求的变量相呼应。　　如果客户端是浏览器的话，那么用户浏览器应保留发送了该请求的页面，而不产生任何文档视图上的变化，即使按照规范新的或更新后的元信息应当被应用到用户浏览器活动视图中的文档。　　由于204响应被禁止包含任何消息体，因此它始终以消息头后的第一个空行结尾。205服务器成功处理了请求，且没有返回任何内容。但是与204响应不同，返回此状态码的响应要求请求者重置文档视图。该响应主要是被用于接受用户输入后，立即重置表单，以便用户能够轻松地开始另一次输入。　　与204响应一样，该响应也被禁止包含任何消息体，且以消息头后的第一个空行结束。206服务器已经成功处理了部分GET请求。类似于FlashGet或者迅雷这类的HTTP下载工具都是使用此类响应实现断点续传或者将一个大文档分解为多个下载段同时下载。　　该请求必须包含Range头信息来指示客户端希望得到的内容范围，并且可能包含If-Range来作为请求条件。　　响应必须包含如下的头部域：　　Content-Range用以指示本次响应中返回的内容的范围；如果是Content-Type为multipart/byteranges的多段下载，则每一multipart段中都应包含Content-Range域用以指示本段的内容范围。假如响应中包含Content-Length，那么它的数值必须匹配它返回的内容范围的真实字节数。　　Date　　ETag和/或Content-Location，假如同样的请求本应该返回200响应。　　Expires,Cache-Control，和/或Vary，假如其值可能与之前相同变量的其他响应对应的值不同的话。　　假如本响应请求使用了If-Range强缓存验证，那么本次响应不应该包含其他实体头；假如本响应的请求使用了If-Range弱缓存验证，那么本次响应禁止包含其他实体头；这避免了缓存的实体内容和更新了的实体头信息之间的不一致。否则，本响应就应当包含所有本应该返回200响应中应当返回的所有实体头部域。　　假如ETag或Last-Modified头部不能精确匹配的话，则客户端缓存应禁止将206响应返回的内容与之前任何缓存过的内容组合在一起。　　任何不支持Range以及Content-Range头的缓存都禁止缓存206响应返回的内容。207由WebDAV(RFC2518)扩展的状态码，代表之后的消息体将是一个XML消息，并且可能依照之前子请求数量的不同，包含一系列独立的响应代码。300被请求的资源有一系列可供选择的回馈信息，每个都有自己特定的地址和浏览器驱动的商议信息。用户或浏览器能够自行选择一个首选的地址进行重定向。　　除非这是一个HEAD请求，否则该响应应当包括一个资源特性及地址的列表的实体，以便用户或浏览器从中选择最合适的重定向地址。这个实体的格式由Content-Type定义的格式所决定。浏览器可能根据响应的格式以及浏览器自身能力，自动作出最合适的选择。当然，RFC2616规范并没有规定这样的自动选择该如何进行。　　如果服务器本身已经有了首选的回馈选择，那么在Location中应当指明这个回馈的URI；浏览器可能会将这个Location值作为自动重定向的地址。此外，除非额外指定，否则这个响应也是可缓存的。301被请求的资源已永久移动到新位置，并且将来任何对此资源的引用都应该使用本响应返回的若干个URI之一。如果可能，拥有链接编辑功能的客户端应当自动把请求的地址修改为从服务器反馈回来的地址。除非额外指定，否则这个响应也是可缓存的。　　新的永久性的URI应当在响应的Location域中返回。除非这是一个HEAD请求，否则响应的实体中应当包含指向新的URI的超链接及简短说明。　　如果这不是一个GET或者HEAD请求，因此浏览器禁止自动进行重定向，除非得到用户的确认，因为请求的条件可能因此发生变化。　　注意：对于某些使用HTTP/1.0协议的浏览器，当它们发送的POST请求得到了一个301响应的话，接下来的重定向请求将会变成GET方式。302请求的资源现在临时从不同的URI响应请求。由于这样的重定向是临时的，客户端应当继续向原有地址发送以后的请求。只有在Cache-Control或Expires中进行了指定的情况下，这个响应才是可缓存的。　　新的临时性的URI应当在响应的Location域中返回。除非这是一个HEAD请求，否则响应的实体中应当包含指向新的URI的超链接及简短说明。　　如果这不是一个GET或者HEAD请求，那么浏览器禁止自动进行重定向，除非得到用户的确认，因为请求的条件可能因此发生变化。　　注意：虽然RFC1945和RFC2068规范不允许客户端在重定向时改变请求的方法，但是很多现存的浏览器将302响应视作为303响应，并且使用GET方式访问在Location中规定的URI，而无视原先请求的方法。状态码303和307被添加了进来，用以明确服务器期待客户端进行何种反应。303对应当前请求的响应可以在另一个URI上被找到，而且客户端应当采用GET的方式访问那个资源。这个方法的存在主要是为了允许由脚本激活的POST请求输出重定向到一个新的资源。这个新的URI不是原始资源的替代引用。同时，303响应禁止被缓存。当然，第二个请求（重定向）可能被缓存。　　新的URI应当在响应的Location域中返回。除非这是一个HEAD请求，否则响应的实体中应当包含指向新的URI的超链接及简短说明。　　注意：许多HTTP/1.1版以前的浏览器不能正确理解303状态。如果需要考虑与这些浏览器之间的互动，302状态码应该可以胜任，因为大多数的浏览器处理302响应时的方式恰恰就是上述规范要求客户端处理303响应时应当做的。304如果客户端发送了一个带条件的GET请求且该请求已被允许，而文档的内容（自上次访问以来或者根据请求的条件）并没有改变，则服务器应当返回这个状态码。304响应禁止包含消息体，因此始终以消息头后的第一个空行结尾。　　该响应必须包含以下的头信息：　　Date，除非这个服务器没有时钟。假如没有时钟的服务器也遵守这些规则，那么代理服务器以及客户端可以自行将Date字段添加到接收到的响应头中去（正如RFC2068中规定的一样），缓存机制将会正常工作。　　ETag和/或Content-Location，假如同样的请求本应返回200响应。　　Expires,Cache-Control，和/或Vary，假如其值可能与之前相同变量的其他响应对应的值不同的话。　　假如本响应请求使用了强缓存验证，那么本次响应不应该包含其他实体头；否则（例如，某个带条件的GET请求使用了弱缓存验证），本次响应禁止包含其他实体头；这避免了缓存了的实体内容和更新了的实体头信息之间的不一致。　　假如某个304响应指明了当前某个实体没有缓存，那么缓存系统必须忽视这个响应，并且重复发送不包含限制条件的请求。　　假如接收到一个要求更新某个缓存条目的304响应，那么缓存系统必须更新整个条目以反映所有在响应中被更新的字段的值。305被请求的资源必须通过指定的代理才能被访问。Location域中将给出指定的代理所在的URI信息，接收者需要重复发送一个单独的请求，通过这个代理才能访问相应资源。只有原始服务器才能建立305响应。　　注意：RFC2068中没有明确305响应是为了重定向一个单独的请求，而且只能被原始服务器建立。忽视这些限制可能导致严重的安全后果。306在最新版的规范中，306状态码已经不再被使用。307请求的资源现在临时从不同的URI响应请求。由于这样的重定向是临时的，客户端应当继续向原有地址发送以后的请求。只有在Cache-Control或Expires中进行了指定的情况下，这个响应才是可缓存的。　　新的临时性的URI应当在响应的Location域中返回。除非这是一个HEAD请求，否则响应的实体中应当包含指向新的URI的超链接及简短说明。因为部分浏览器不能识别307响应，因此需要添加上述必要信息以便用户能够理解并向新的URI发出访问请求。　　如果这不是一个GET或者HEAD请求，那么浏览器禁止自动进行重定向，除非得到用户的确认，因为请求的条件可能因此发生变化。4001、语义有误，当前请求无法被服务器理解。除非进行修改，否则客户端不应该重复提交这个请求。　　2、请求参数有误。401当前请求需要用户验证。该响应必须包含一个适用于被请求资源的WWW-Authenticate信息头用以询问用户信息。客户端可以重复提交一个包含恰当的Authorization头信息的请求。如果当前请求已经包含了Authorization证书，那么401响应代表着服务器验证已经拒绝了那些证书。如果401响应包含了与前一个响应相同的身份验证询问，且浏览器已经至少尝试了一次验证，那么浏览器应当向用户展示响应中包含的实体信息，因为这个实体信息中可能包含了相关诊断信息。参见RFC2617。402该状态码是为了将来可能的需求而预留的。403服务器已经理解请求，但是拒绝执行它。与401响应不同的是，身份验证并不能提供任何帮助，而且这个请求也不应该被重复提交。如果这不是一个HEAD请求，而且服务器希望能够讲清楚为何请求不能被执行，那么就应该在实体内描述拒绝的原因。当然服务器也可以返回一个404响应，假如它不希望让客户端获得任何信息。404请求失败，请求所希望得到的资源未被在服务器上发现。没有信息能够告诉用户这个状况到底是暂时的还是永久的。假如服务器知道情况的话，应当使用410状态码来告知旧资源因为某些内部的配置机制问题，已经永久的不可用，而且没有任何可以跳转的地址。404这个状态码被广泛应用于当服务器不想揭示到底为何请求被拒绝或者没有其他适合的响应可用的情况下。405请求行中指定的请求方法不能被用于请求相应的资源。该响应必须返回一个Allow头信息用以表示出当前资源能够接受的请求方法的列表。　　鉴于PUT，DELETE方法会对服务器上的资源进行写操作，因而绝大部分的网页服务器都不支持或者在默认配置下不允许上述请求方法，对于此类请求均会返回405错误。406请求的资源的内容特性无法满足请求头中的条件，因而无法生成响应实体。　　除非这是一个HEAD请求，否则该响应就应当返回一个包含可以让用户或者浏览器从中选择最合适的实体特性以及地址列表的实体。实体的格式由Content-Type头中定义的媒体类型决定。浏览器可以根据格式及自身能力自行作出最佳选择。但是，规范中并没有定义任何作出此类自动选择的标准。407　与401响应类似，只不过客户端必须在代理服务器上进行身份验证。代理服务器必须返回一个Proxy-Authenticate用以进行身份询问。客户端可以返回一个Proxy-Authorization信息头用以验证。参见RFC2617。408请求超时。客户端没有在服务器预备等待的时间内完成一个请求的发送。客户端可以随时再次提交这一请求而无需进行任何更改。409由于和被请求的资源的当前状态之间存在冲突，请求无法完成。这个代码只允许用在这样的情况下才能被使用：用户被认为能够解决冲突，并且会重新提交新的请求。该响应应当包含足够的信息以便用户发现冲突的源头。　　冲突通常发生于对PUT请求的处理中。例如，在采用版本检查的环境下，某次PUT提交的对特定资源的修改请求所附带的版本信息与之前的某个（第三方）请求向冲突，那么此时服务器就应该返回一个409错误，告知用户请求无法完成。此时，响应实体中很可能会包含两个冲突版本之间的差异比较，以便用户重新提交归并以后的新版本。410被请求的资源在服务器上已经不再可用，而且没有任何已知的转发地址。这样的状况应当被认为是永久性的。如果可能，拥有链接编辑功能的客户端应当在获得用户许可后删除所有指向这个地址的引用。如果服务器不知道或者无法确定这个状况是否是永久的，那么就应该使用404状态码。除非额外说明，否则这个响应是可缓存的。　　410响应的目的主要是帮助网站管理员维护网站，通知用户该资源已经不再可用，并且服务器拥有者希望所有指向这个资源的远端连接也被删除。这类事件在限时、增值服务中很普遍。同样，410响应也被用于通知客户端在当前服务器站点上，原本属于某个个人的资源已经不再可用。当然，是否需要把所有永久不可用的资源标记为'410Gone'，以及是否需要保持此标记多长时间，完全取决于服务器拥有者。411服务器拒绝在没有定义Content-Length头的情况下接受请求。在添加了表明请求消息体长度的有效Content-Length头之后，客户端可以再次提交该请求。412服务器在验证在请求的头字段中给出先决条件时，没能满足其中的一个或多个。这个状态码允许客户端在获取资源时在请求的元信息（请求头字段数据）中设置先决条件，以此避免该请求方法被应用到其希望的内容以外的资源上。413服务器拒绝处理当前请求，因为该请求提交的实体数据大小超过了服务器愿意或者能够处理的范围。此种情况下，服务器可以关闭连接以免客户端继续发送此请求。　　如果这个状况是临时的，服务器应当返回一个Retry-After的响应头，以告知客户端可以在多少时间以后重新尝试。414请求的URI长度超过了服务器能够解释的长度，因此服务器拒绝对该请求提供服务。这比较少见，通常的情况包括：　　本应使用POST方法的表单提交变成了GET方法，导致查询字符串（QueryString）过长。　　重定向URI“黑洞”，例如每次重定向把旧的URI作为新的URI的一部分，导致在若干次重定向后URI超长。　　客户端正在尝试利用某些服务器中存在的安全漏洞攻击服务器。这类服务器使用固定长度的缓冲读取或操作请求的URI，当GET后的参数超过某个数值后，可能会产生缓冲区溢出，导致任意代码被执行[1]。没有此类漏洞的服务器，应当返回414状态码。415对于当前请求的方法和所请求的资源，请求中提交的实体并不是服务器中所支持的格式，因此请求被拒绝。416如果请求中包含了Range请求头，并且Range中指定的任何数据范围都与当前资源的可用范围不重合，同时请求中又没有定义If-Range请求头，那么服务器就应当返回416状态码。　　假如Range使用的是字节范围，那么这种情况就是指请求指定的所有数据范围的首字节位置都超过了当前资源的长度。服务器也应当在返回416状态码的同时，包含一个Content-Range实体头，用以指明当前资源的长度。这个响应也被禁止使用multipart/byteranges作为其Content-Type。417在请求头Expect中指定的预期内容无法被服务器满足，或者这个服务器是一个代理服务器，它有明显的证据证明在当前路由的下一个节点上，Expect的内容无法被满足。421从当前客户端所在的IP地址到服务器的连接数超过了服务器许可的最大范围。通常，这里的IP地址指的是从服务器上看到的客户端地址（比如用户的网关或者代理服务器地址）。在这种情况下，连接数的计算可能涉及到不止一个终端用户。422从当前客户端所在的IP地址到服务器的连接数超过了服务器许可的最大范围。通常，这里的IP地址指的是从服务器上看到的客户端地址（比如用户的网关或者代理服务器地址）。在这种情况下，连接数的计算可能涉及到不止一个终端用户。422请求格式正确，但是由于含有语义错误，无法响应。（RFC4918WebDAV）423Locked　　当前资源被锁定。（RFC4918WebDAV）424由于之前的某个请求发生的错误，导致当前请求失败，例如PROPPATCH。（RFC4918WebDAV）425在WebDavAdvancedCollections草案中定义，但是未出现在《WebDAV顺序集协议》（RFC3658）中。426客户端应当切换到TLS/1.0。（RFC2817）449由微软扩展，代表请求应当在执行完适当的操作后进行重试。500服务器遇到了一个未曾预料的状况，导致了它无法完成对请求的处理。一般来说，这个问题都会在服务器的程序码出错时出现。501服务器不支持当前请求所需要的某个功能。当服务器无法识别请求的方法，并且无法支持其对任何资源的请求。502作为网关或者代理工作的服务器尝试执行请求时，从上游服务器接收到无效的响应。503由于临时的服务器维护或者过载，服务器当前无法处理请求。这个状况是临时的，并且将在一段时间以后恢复。如果能够预计延迟时间，那么响应中可以包含一个Retry-After头用以标明这个延迟时间。如果没有给出这个Retry-After信息，那么客户端应当以处理500响应的方式处理它。　　注意：503状态码的存在并不意味着服务器在过载的时候必须使用它。某些服务器只不过是希望拒绝客户端的连接。504作为网关或者代理工作的服务器尝试执行请求时，未能及时从上游服务器（URI标识出的服务器，例如HTTP、FTP、LDAP）或者辅助服务器（例如DNS）收到响应。　　注意：某些代理服务器在DNS查询超时时会返回400或者500错误505服务器不支持，或者拒绝支持在请求中使用的HTTP版本。这暗示着服务器不能或不愿使用与客户端相同的版本。响应中应当包含一个描述了为何版本不被支持以及服务器支持哪些协议的实体。506由《透明内容协商协议》（RFC2295）扩展，代表服务器存在内部配置错误：被请求的协商变元资源被配置为在透明内容协商中使用自己，因此在一个协商处理中不是一个合适的重点。507服务器无法存储完成请求所必须的内容。这个状况被认为是临时的。WebDAV(RFC4918)509服务器达到带宽限制。这不是一个官方的状态码，但是仍被广泛使用。510获取资源所需要的策略并没有没满足。（RFC2774）
- 建站经验
- 155阅读
- 2022-04-28

判断百度蜘蛛的方法和百度真假蜘蛛IP如何识别
百度蜘蛛是什么？百度蜘蛛，是百度搜索引擎的一个自动程序。它的作用是访问收集整理互联网上的网页、图片、视频等内容，然后分门别类建立索引数据库，使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。我们可以理解为百度蜘蛛就是用来抓取网站链接的IP，小编经常会听到百度蜘蛛来的太频繁，服务器要被抓爆了，如果你无法识别百度蜘蛛，你怎么知道是百度蜘蛛抓爆的呢?也有出现百度蜘蛛都不来了的情况，还有很多站点想得到百度蜘蛛的IP段，想把IP加入白名单，但无法识别百度IP。怎么才能识别正确的百度蜘蛛呢？一、查看UA如果UA都不对，可以直接判断非百度搜索的蜘蛛，目前对外公布过的UA是：移动UA:Mozilla/5.0(Linux;u;Android4.2.2;zh-cn;)AppleWebKit/534.46(KHTML,likeGecko)Version/5.1MobileSafari/10600.6.3(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)PCUA:Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)新增渲染UA:移动UA：Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,likeGecko)Version/9.0Mobile/13B143Safari/601.1(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)PCUA：Mozilla/5.0(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)二、反查IP站长可以通过DNS反查IP的方式判断某只spider是否来自百度搜索引擎。根据平台不同验证方法不同，如linux/windows/os三种平台下的验证方法分别如下：正确识别百度蜘蛛(1)、在linux平台下，您可以使用hostip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名，非*.baidu.com或*.baidu.jp即为冒充。(2)、在windows平台或者IBMOS/2平台下，您可以使用nslookupip命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器输入nslookupxxx.xxx.xxx.xxx(IP地址)就能解析ip，来判断是否来自Baiduspider的抓取，Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名，非*.baidu.com或*.baidu.jp即为冒充。在运行中大概CMD命令行窗口，然后输入nslookupIP地址(例如211.112.11.41)，如果得到有baiduspider等结果，就意味着此IP时百度蜘蛛的专用IP。(3)、在macos平台下，您可以使用dig命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器输入digxxx.xxx.xxx.xxx(IP地址)就能解析ip，来判断是否来自Baiduspider的抓取，Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名，非*.baidu.com或*.baidu.jp即为冒充。以下是PHP的IP反查代码：$dnsadd=gethostbyaddr($_SERVER["REMOTE_ADDR"]); if((substr($dnsadd, -strlen("baidu.com")) ==="baidu.com")||(substr($dnsadd, -strlen("baidu.jp")) ==="baidu.jp")) //是真的百度蜘蛛 else //是模拟的百度蜘蛛,假蜘蛛下面列举了百度不同IP段常见蜘蛛的一些详情情况，及所谓的降权蜘蛛，沙盒蜘蛛，高权重蜘蛛等等。百度蜘蛛159.226.50.*180.76.5.*220.181.158.107百度竞价蜘蛛125.39.78.18561.135.165.134117.34.74.66118.122.188.194119.63.196.9每天这个IP段只增不减很有可能进沙盒或K站218.30.118.*220.181.68.*123.125.68.*抓取内页收录的，权重较低，爬过此段的内页文章暂时被收录但不放出来(意思也就是说待定)，因不是原创或采集文章。(百度网页爬虫(百度图片爬虫)123.125.71.*123.181.108.77这个ip段出现在新站及站点有不正常现象后203.208.60.*183.91.40.144代表百度蜘蛛IP来访准备抓取你东西220.181.7.*123.125.66.*【61.135.186.*】百度联盟爬虫，说白了就是百度统计【121.14.89.*】这个ip段作为度过新站考察期【123.15.**.**】百度图片爬虫【123.125.68.*】这个蜘蛛经常来，别的来的少，表示网站可能要进入沙盒了，或被者降权【124.248.34.52】搜外站长工具蜘蛛【125.90.88.*】也属于百度蜘蛛IP主要造成成分，是新上线站较多，还有使用过站长工具，或SEO综合检测造成的，没有多大用【180.149.130.*】伪装百度蜘蛛IP【210.72.225.*】这个ip段不间断巡逻各站，就是路过一下【220.181.108.*】专用抓取首页ip权重段，一般返回代码30400代表未更新，如果是200064别担心这不是K站，可能是网站是动态的，所以返回就是这个代码。【220.181.108.91】属于综合的。主要抓取首页和内页或者其它页面。属于权重IP段，抓过的文章或首页基本24小时放出来【220.181.108.75】重点抓取更新文章的内页达到90%，8%的抓取首页，2%其他权重ip段，抓过的文章或首页基本24小时放出来【220.181.108.92】98%抓取首页可能还会抓取其他「不是指内页)属于权重IP段此段爬过的文章或首页基本24小时放出来【220.181.108.95】这个是百度抓取首页的专用IP，基本来说网站会天天隔夜快照，绝对错不了的114站长工具箱(这个是你的网站不稳定时常来的)121.10.141.*119.147.114.213站长工具模仿的百度蜘蛛61.147.98.14661.188.39.16113.98.254.245117.21.220.245117.28.255.42
- 建站经验
- 232阅读
- 2022-04-28