インターネットアーカイブや魚拓に詳しい人来て (29)

←← 掲示板一覧に戻る ← スレッド一覧に戻る

1 野に咲く名無し@転載禁止 (b721cd92) 2024/06/25 (火) 19:17:23.014 ID:1RISPlbUc主

農園のスレのアーカイブを取りたいんだけど、
1回目は上手く取得できるんだけど、連続して別のスレを取得しようとすると1個目のスレにURLが変わっちゃって上手く取得できないの😢

2 野に咲く名無し@転載禁止 2024/06/25 (火) 19:19:56.366 ID:1RISPlbUc主

例えば
https://tulipplantation.com/#tulipplantation/1719310643">https://tulipplantation.com/#tulipplantation/1719310643
最初、↑スレのアーカイブを取ったあとに
https://tulipplantation.com/#lab/1719310494">https://tulipplantation.com/#lab/1719310494
2個目のスレをアーカイブしようとすると
https://tulipplantation.com/#tulipplantation/1719310643">https://tulipplantation.com/#tulipplantation/1719310643
↑のURLに勝手に変わって上手く取得できない😢

3 野に咲く名無し@転載禁止 2024/06/25 (火) 19:20:09.159 ID:Q8Zbdo0Aw

複数のサービス使って取ったら?🥺
アレだけど幾つか纏まってる
https://krsw-wiki.org/wiki/?curid=5662

4 野に咲く名無し@転載禁止 2024/06/25 (火) 19:24:33.667 ID:1RISPlbUc主

>>3
やっぱそれしかないか😢
ありがとね
!pay:10:ID:Q8Zbdo0Aw
-
★ID:Q8Zbdo0Awに10g??を送りました。

5 野に咲く名無し@転載禁止 2024/06/25 (火) 19:25:46.521 ID:Q8Zbdo0Aw

>>4
状況が良く分からんけどシークレットモードとかで開いて一個取得する度に閉じて開いて取ってと繰り返すのはアカンかな🥺

6 野に咲く名無し@転載禁止 2024/06/25 (火) 19:37:18.787 ID:1RISPlbUc主

>>5
Wayback machineの場合、最初にアーカイブしようとしたスレは正しく保存されるんだけど、
https://i.imgur.com/rgbweaT.png" data-lightbox="image">https://i.imgur.com/rgbweaT.png" loading="lazy">
https://i.imgur.com/rgbweaT.png
その後、連続して別のスレをアーカイブしようとすると
https://i.imgur.com/VSHWCxY.png" data-lightbox="image">https://i.imgur.com/VSHWCxY.png" loading="lazy">
https://i.imgur.com/VSHWCxY.png

https://i.imgur.com/2yY6u56.png" data-lightbox="image">https://i.imgur.com/2yY6u56.png" loading="lazy">
https://i.imgur.com/2yY6u56.png
「Done」になっても最初にアーカイブしたスレのリンクが表示されちゃって、2番目のスレがアーカイブできないの😢

7 野に咲く名無し@転載禁止 2024/06/25 (火) 19:38:33.038 ID:1RISPlbUc主

違うURLのはずなのにWayback machine側だと同一のものとして処理されてるっぽい🥺

The same snapshot had been made 2 minutes ago. You can make new capture of this URL after 1 hour.
同じスナップショットが 2 分前に作成されました。 1 時間後にこの URL を新たにキャプチャできるようになります。

8 野に咲く名無し@転載禁止 2024/06/25 (火) 19:39:00.756 ID:Q8Zbdo0Aw

>>6
はえ〜🥺
ウェイバックマシン正直あんま使わないなぁぷゆ🥺
このページじゃ無きゃ駄目なんだって理由でも有るの?🥺

9 野に咲く名無し@転載禁止 2024/06/25 (火) 19:40:16.349 ID:7ZSP90ZIM

魚拓取るならdat保存したほうがよくない?🤔

10 野に咲く名無し@転載禁止 2024/06/25 (火) 19:41:05.337 ID:1RISPlbUc主

>>8
ウェブ魚拓の場合はなぜかわからないけどそもそもアーカイブできない
archive.todayは昔使いまくってたせいかアク禁っぽい😭

11 野に咲く名無し@転載禁止 2024/06/25 (火) 19:43:22.580 ID:M5OB6Cgo0

>>9
みんなで見れない🥺

12 野に咲く名無し@転載禁止 2024/06/25 (火) 19:43:51.497 ID:1RISPlbUc主

>>9
wayback machineの場合、datのURLだと別もの判定されるっぽくて連続でも取得できるんだけど、
例えばスレにアーカイブを貼るときとかにdatファイルだと見づらいから、できれば見やすい形式で取りたい🥺

13 野に咲く名無し@転載禁止 2024/06/25 (火) 19:46:36.622 ID:Q8Zbdo0Aw

>>10
ふーむそっかぁ🥺
確かにウェブ魚拓こっちでも試してみたけど上手く行かんね🥺
vnで今取ってみたけどどう?🥺
上手く行ってたら多少ならぷゆが代行しても良いけど💪🥺
https://archive.vn/6H4hv

14 野に咲く名無し@転載禁止 2024/06/25 (火) 19:47:17.665 ID:FzC8GiNXO

無料webサイト借りて上げれば🥺
ここのルール的に良いかは知らんけど

15 野に咲く名無し@転載禁止 2024/06/25 (火) 19:49:26.503 ID:4X1VG9ytW

URLの構造上#がfragmentになるから同一ページという扱いになる

https://tulipplantation.com/#tulipplantation/1719310643">https://tulipplantation.com/#tulipplantation/1719310643

https://tulipplantation.com/#lab/1719310494">https://tulipplantation.com/#lab/1719310494
だと
https://tulipplantation.com/の中の同一ページ内コンテンツって解釈

16 野に咲く名無し@転載禁止 2024/06/25 (火) 19:50:54.414 ID:1RISPlbUc主

>>13
.vnだとできました!
ありがとうございます!🥰🥰🥰
!pay:100:ID:Q8Zbdo0Aw
-
★ID:Q8Zbdo0Awに100g??を送りました。

17 野に咲く名無し@転載禁止 2024/06/25 (火) 19:52:11.603 ID:1RISPlbUc主

>>15
学びがある
!pay:39:ID:4X1VG9ytW
やっぱ"#"が原因だったか🥺
ちなみに対策というか回避策みたいなものってありますかね?
-
★ID:4X1VG9ytWに39g??を送りました。

18 野に咲く名無し@転載禁止 2024/06/25 (火) 19:55:32.164 ID:1RISPlbUc主

>>14
できればみんなで使える方法の方がいいんだよね🥺
かといって個人で契約して誰でも使えるようにした場合管理しきれなさそうで…🥺

19 野に咲く名無し@転載禁止 2024/06/25 (火) 19:55:56.911 ID:4X1VG9ytW

>>17
ない
URLはそういう構造って規定されてるからwayback machineの解釈が正しい
作るときにfragmentを含まないURL構造にするくらいだけどそれは作り手側の話だね

20 野に咲く名無し@転載禁止 2024/06/25 (火) 19:57:57.553 ID:1RISPlbUc主

>>19
学びがある
ってことはarchive.today系のほうが特殊って感じなんやね
詳しい説明ありがとう
!pay:100:ID:4X1VG9ytW
-
★ID:4X1VG9ytWに100g??を送りました。

21 野に咲く名無し@転載禁止 2024/06/25 (火) 20:02:36.982 ID:4yKV8OZg8

>>14
レスの権利は書き込んだ人間にあるから
ワイみたいに他のサイトに残して欲しくない人間が一人でもいたら潰せるぞ

22 野に咲く名無し@転載禁止 2024/06/25 (火) 20:04:40.573 ID:4X1VG9ytW

実際SPAみたいな感じでfragmentをトリガーに各スレをレンダリングしてたと思うから同一ページって解釈自体は間違ってないんよね
archive.todayはwayback machineとそもそもの思想が違うから関係なく読み込むって感じ

23 野に咲く名無し@転載禁止 2024/06/25 (火) 20:08:27.525 ID:1RISPlbUc主

>>22
なるほどなぁ
archive.today系が使えてよかった🥺

24 野に咲く名無し@転載禁止 2024/06/25 (火) 20:22:38.963 ID:Q8Zbdo0Aw

>>16
おぉ良かった🤗
アーカイブって何故か名前(?)違いで複数個有るんだよね🥺
🌷有難う😘

25 野に咲く名無し@転載禁止 2024/06/25 (火) 20:24:37.294 ID:fhMulHNbS

ちょっと魚拓とは話それちゃうけど
Sikiで防弾のスレのjsonファイル残ってるんだけどこれってスレッド形式で復元する方法とかできないかな
こんな感じで書き込み見れるけど見づらい
https://i.ibb.co/tH6hDY7/1719314654.png" data-lightbox="image">https://i.ibb.co/tH6hDY7/1719314654.png" loading="lazy">
https://i.ibb.co/tH6hDY7/1719314654.png

26 野に咲く名無し@転載禁止 2024/06/25 (火) 20:25:32.865 ID:1RISPlbUc主

sikiってjson形式で保存してるんや😳

27 野に咲く名無し@転載禁止 2024/06/25 (火) 20:31:57.842 ID:fhMulHNbS

すまん、json内にあるスレのURL開いたら見れた
けどこれ別のデバイスとかで見れることできないかな

https://i.ibb.co/jv2brJW/1719315038.png" data-lightbox="image">https://i.ibb.co/jv2brJW/1719315038.png" loading="lazy">
https://i.ibb.co/jv2brJW/1719315038.png

28 野に咲く名無し@転載禁止 2024/06/25 (火) 20:42:55.267 ID:8ZIutA73O

IP漏れてるんだからID出すなよ

29 野に咲く名無し@転載禁止 2024/06/25 (火) 20:46:49.158 ID:fhMulHNbS

IDからIPわかるのか申し訳ない