[技術討論] 搵軟件管理HDD/NAS嘅10TB文件

提示: 作者被禁止或刪除 內容自動屏蔽

留名學野。

TOP

本帖最後由 eo38cl 於 2023-11-4 14:54 編輯

Windows下,最好用係Whereisit,但已停止更新,最後一個版本係2014(build 220),官網已買唔到。

然後係WinCatalogEverythingabeMeda (前身CDWinder)

TOP

提示: 作者被禁止或刪除 內容自動屏蔽

TOP

咁多ching,搭單問一問,有無prog 係可check hdd 內有無重複的file呢?

TOP

提示: 作者被禁止或刪除 內容自動屏蔽

TOP

本帖最後由 SuperElephant 於 2023-11-13 19:46 編輯

回覆 5# ericauky
大型檔案比對需時, 以下答案會對比每個檔案的全部內容(hash), 而非檔案名稱

開cmd打"python --version"然後enter, 如無顯示version, 請安裝Python
新增檔案C:\dedup.py將以下代碼copy+paste落dedup.py然後save
再開cmd, 行: python "C:\dedup.py" "D:\target_directory"
"D:\target_directory" 改成你需要搵重複的路徑

代碼:
  1. import os
  2. import hashlib
  3. import argparse

  4. def calculate_sha256(file_path):
  5.     with open(file_path, 'rb') as file:
  6.         bytes = file.read()
  7.         readable_hash = hashlib.sha256(bytes).hexdigest()
  8.     return readable_hash

  9. def find_duplicates(target_directory):
  10.     file_hashes = {}
  11.     for dirpath, dirnames, filenames in os.walk(target_directory):
  12.         for filename in filenames:
  13.             file_path = os.path.join(dirpath, filename)
  14.             file_hash = calculate_sha256(file_path)
  15.             if file_hash in file_hashes:
  16.                 file_hashes[file_hash].append(file_path)
  17.             else:
  18.                 file_hashes[file_hash] = [file_path]

  19.     duplicates = {k: v for k, v in file_hashes.items() if len(v) > 1}
  20.     return duplicates

  21. # Parse command-line arguments
  22. parser = argparse.ArgumentParser(description='Find duplicate files in a directory.')
  23. parser.add_argument('directory', type=str, help='The target directory.')
  24. args = parser.parse_args()

  25. target_directory = args.directory
  26. duplicates = find_duplicates(target_directory)

  27. for hash, file_paths in duplicates.items():
  28.     print(f"Duplicate files for hash {hash}:")
  29.     for file_path in file_paths:
  30.         print(f"\t{file_path}")

  31. print(f"Scan completed. Found {len(duplicates)} duplicate hashes.")
複製代碼

TOP

WizTree
可以Export CSV,外置HDD都可以用

TOP

咁多ching,搭單問一問,有無prog 係可check hdd 內有無重複的file呢?
ericauky 發表於 2023-11-4 22:51



Duplicate Cleaner Free
https://www.duplicatecleaner.com/

TOP

提示: 作者被禁止或刪除 內容自動屏蔽

TOP