搵軟件管理HDD/NAS嘅10TB文件

CarlR696 發短消息加為好友 CarlR696 當前離線 UID 367294 帖子 72 精華 0 積分 51 EPC Dollar 51 註冊時間 2023-10-29 最後登錄 2023-12-30 Banned	*1^# 跳轉到 »* 倒序看帖** 打印字體大小: tT 發表於 2023-11-4 01:04 \| 只看該作者 [技術討論] 搵軟件管理HDD/NAS嘅10TB文件提示: 作者被禁止或刪除內容自動屏蔽收藏分享 0 0

bongbong3481

進階會員

Rank: 3 Rank: 3 Rank: 3

2^#

發表於 2023-11-4 09:56 | 只看該作者

留名學野。

TOP

eo38cl

中級會員

Rank: 2 Rank: 2

3^#

發表於 2023-11-4 14:53 | 只看該作者

本帖最後由 eo38cl 於 2023-11-4 14:54 編輯

Windows下，最好用係Whereisit，但已停止更新，最後一個版本係2014(build 220)，官網已買唔到。

然後係WinCatalog、Everything、abeMeda (前身CDWinder)等

TOP

CarlR696 發短消息加為好友 CarlR696 當前離線 UID 367294 帖子 72 精華 0 積分 51 EPC Dollar 51 註冊時間 2023-10-29 最後登錄 2023-12-30 Banned	4^# 發表於 2023-11-4 20:57 \| 只看該作者提示: 作者被禁止或刪除內容自動屏蔽

	TOP

ericauky

中級會員

Rank: 2 Rank: 2

5^#

發表於 2023-11-4 22:51 | 只看該作者

咁多ching，搭單問一問，有無prog 係可check hdd 內有無重複的file呢？

TOP

CarlR696 發短消息加為好友 CarlR696 當前離線 UID 367294 帖子 72 精華 0 積分 51 EPC Dollar 51 註冊時間 2023-10-29 最後登錄 2023-12-30 Banned	6^# 發表於 2023-11-5 12:07 \| 只看該作者提示: 作者被禁止或刪除內容自動屏蔽

	TOP

SuperElephant

初級會員

Rank: 1

7^#

發表於 2023-11-13 16:31 | 只看該作者

本帖最後由 SuperElephant 於 2023-11-13 19:46 編輯

回覆 5# ericauky
大型檔案比對需時, 以下答案會對比每個檔案的全部內容(hash), 而非檔案名稱

開cmd打"python --version"然後enter, 如無顯示version, 請安裝Python
新增檔案C:\dedup.py將以下代碼copy+paste落dedup.py然後save
再開cmd, 行: python "C:\dedup.py" "D:\target_directory"
"D:\target_directory" 改成你需要搵重複的路徑

代碼：

import os
import hashlib
import argparse
def calculate_sha256(file_path):
with open(file_path, 'rb') as file:
bytes = file.read()
readable_hash = hashlib.sha256(bytes).hexdigest()
return readable_hash
def find_duplicates(target_directory):
file_hashes = {}
for dirpath, dirnames, filenames in os.walk(target_directory):
for filename in filenames:
file_path = os.path.join(dirpath, filename)
file_hash = calculate_sha256(file_path)
if file_hash in file_hashes:
file_hashes[file_hash].append(file_path)
else:
file_hashes[file_hash] = [file_path]
duplicates = {k: v for k, v in file_hashes.items() if len(v) > 1}
return duplicates
# Parse command-line arguments
parser = argparse.ArgumentParser(description='Find duplicate files in a directory.')
parser.add_argument('directory', type=str, help='The target directory.')
args = parser.parse_args()
target_directory = args.directory
duplicates = find_duplicates(target_directory)
for hash, file_paths in duplicates.items():
print(f"Duplicate files for hash {hash}:")
for file_path in file_paths:
print(f"\t{file_path}")
print(f"Scan completed. Found {len(duplicates)} duplicate hashes.")

複製代碼

TOP

hoho1986

進階會員

Rank: 3 Rank: 3 Rank: 3

8^#

發表於 2023-11-17 09:57 | 只看該作者

WizTree
可以Export CSV，外置HDD都可以用

TOP

Jip仔

進階會員

Rank: 3 Rank: 3 Rank: 3

9^#

發表於 2023-11-17 16:24 | 只看該作者

咁多ching，搭單問一問，有無prog 係可check hdd 內有無重複的file呢？
ericauky 發表於 2023-11-4 22:51

Duplicate Cleaner Free
https://www.duplicatecleaner.com/

TOP

CarlR696 發短消息加為好友 CarlR696 當前離線 UID 367294 帖子 72 精華 0 積分 51 EPC Dollar 51 註冊時間 2023-10-29 最後登錄 2023-12-30 Banned	10^# 發表於 2023-11-17 17:16 \| 只看該作者提示: 作者被禁止或刪除內容自動屏蔽

	TOP

[技術討論] 搵軟件管理HDD/NAS嘅10TB文件

[收藏此主題] [關注此主題的新回覆]

[通過 QQ、MSN 分享給朋友]