维基百科讨论:使用时光机
外观
Wayback Machine存档后的页面消失
[编辑]虽然不是维基百科的工具,但是想问问有没有遇到相同情况的朋友。因条目需要,参考Wikipedia:使用时光机,使用Wayback Machine存档该页面后,提示存档成功并生成了存档链接,一开始是可以正常查看的,但一段时间后页面转而提示“The Wayback Machine has not archived that URL.”,尝试了两次都是同样的情况。该站点似乎并没有robots.txt文件,并且也存在其他页面的正常存档。由于存档链接已经添加到条目中,在这种情况下是否应该先移除存档链接呢?--立日(留言) 2021年6月23日 (三) 10:20 (UTC)
- 如果您说的是这笔存档,我刚刚到web.archive官网上去重新操作一次就成了,您可以在天主教厦门教区下方直接点击看看,不过纪录时间是刚刚的下午六点多,也没看到你先前的存档,可能有些技术问题吧。此外就算在官网存档,我也偶尔会遇到类似你说的状况,要过几个小时才找的到。如下次再遇到这种情况,我会建议先放着,过至少几小时到官网上确认有没有存到档,没有就重新存一次。--回廊彼端(留言) 2021年6月23日 (三) 11:05 (UTC)
- @迴廊彼端:谢谢,我刚刚可以打开您提供的这版本的存档,但现在似乎又再次失效了。--立日(留言) 2021年6月23日 (三) 11:26 (UTC)
- @回廊彼端:不好意思,似乎是间歇性失效,突然存档又出现了。感觉不是很稳定的样子。--立日(留言) 2021年6月23日 (三) 11:31 (UTC)
Wayback Machine不能存档am730的网页,大家能推荐其它存档方法吗?
[编辑]am730似乎只能从香港访问,内中报道如[1]在用Wayback Machine存档时出错。求推荐其它存档方法。谢谢!--Benevolen(留言) 2022年1月9日 (日) 03:30 (UTC)
- 去Google搜一下然后看网页快照,比如你这个。快照--在下荷花,请多指教(欢迎签到) 2022年1月9日 (日) 10:26 (UTC)
- @Benevolen--在下荷花,请多指教(欢迎签到) 2022年1月9日 (日) 10:26 (UTC)
- 感谢指点!还改为这个功能不复存在了--Benevolen(留言) 2022年1月9日 (日) 20:54 (UTC)
- 看来需要程序员开发开源的网页存档器以供我们自建。--Txkk(留言) 2022年1月9日 (日) 13:42 (UTC)
谷歌网页快照能存档多久?
[编辑]我找到一个光明日报来源,但是光明网上的页面已经被删除了,然而谷歌网页快照还存了档,我现在在该来源的存档URL里填的网页快照网址,这个会被谷歌删除吗?如何能把谷歌快照的内容备份进web archive?--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月26日 (三) 14:49 (UTC)
- 会删,不确定保留多久,可能几周到几个月吧。archive.is支持存档和索引(检索)谷歌快照,但该网站最近似乎下线了。web archive我不确定能否存档快照,经测可以。以前是不行的,因为robots.txt,以前不存、会删,2017年4月开始忽略。--YFdyh000(留言) 2022年10月26日 (三) 17:30 (UTC)
- “但该网站最近似乎下线了”,并没有。根据en:archive.today#Cloudflare_DNS_availability所述,用了Cloudflare的DNS服务,可能会打不开这个网站。你用了什么翻墙软件?--Txkk(留言) 2022年10月28日 (五) 10:01 (UTC)
- 感谢提示,困扰已久。可能软件配置和网站问题兼有,出问题时可能在调用OpenDNS。之前访问总是看到nginx的欢迎页面,https正常,所以我以为网站故障了。--YFdyh000(留言) 2022年11月1日 (二) 10:20 (UTC)
- 但是我存了以后发现webarchive好像最后存的是光明网首页,你能试试看怎么在web archive存谷歌快照吗--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月27日 (四) 03:42 (UTC)
- 见我那个“可以”的链接。快照页面会因JS自动跳转到光明网,必须想办法(比如禁用JS,或者改URL参数)打开纯文字版来存档。其实不存档也非不行,应该还有图书馆能查到,不过存档了更方便查证就是。--YFdyh000(留言) 2022年10月27日 (四) 03:45 (UTC)
- 哦没事了,存好了--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月27日 (四) 03:44 (UTC)
- “但该网站最近似乎下线了”,并没有。根据en:archive.today#Cloudflare_DNS_availability所述,用了Cloudflare的DNS服务,可能会打不开这个网站。你用了什么翻墙软件?--Txkk(留言) 2022年10月28日 (五) 10:01 (UTC)
- Google 页库存档一段时间后会删的。建议你用 https://web.archive.org/save 存档。 -- Shyangs(留言) 2022年10月26日 (三) 17:38 (UTC)
- 网址不是必须的。--Kethyga(留言) 2022年10月27日 (四) 05:10 (UTC)
标题文本
[编辑]存不了的网站……
昨天晚上发现知乎zhihu.com似乎保存不了……存档结果是“您当前请求存在异常,暂时限制本次访问”
应该还有几个国内大网站不能保存。
- 淘宝taobao.com
- 新浪微博weibo.com
- 网易云音乐music.163.com
--Zyksnowy(留言) 2022年11月24日 (四) 04:42 (UTC)
- 顺路报告,近几个月,用archive.is查看或存档知乎页面,似乎无法成功,且会导致archive.is网站不再能正常访问(出现异常cookie)。不知道其他人是否能重现。--YFdyh000(留言) 2022年11月24日 (四) 05:39 (UTC)
- 这四个网站都有单独的图片服务器,可以单独保存……可能容易丢失网址
- gw.alicdn.com
- wx1.sinaimg.cn
- p4.music.126.net
- pic1.zhimg.com--Zyksnowy(留言) 2022年11月26日 (六) 18:24 (UTC)