rsync가 동기화를 위해 의미있는 양의 데이터 전송을 저장합니까?
1) zip 파일
2) ASCII 기갑 GPG 암호화 파일
3) Mathematica .mx 파일
각각?
일반적인 시나리오는 이미 오래된 사본이 있고 압축 및 / 또는 암호화 된 파일이 동기화 할 파일이 아니라 압축되지 않은 파일과 암호화되지 않은 파일이 존재할 수 있다는 것입니다.
답변
암호화 또는 압축 파일의 문제점은 데이터에서 1 바이트 만 수정하더라도 변경된 데이터 바이트뿐만 아니라 나머지 모든 파일 내용이 다르다는 것입니다.
이것은 rsync가 데이터 전송을 줄이기 위해 사용하는 하나의 전략, 즉 전체 파일이 아닌 파일의 변경된 섹션 만 전송하는 것을 막습니다.
따라서 디스크에 공간이 필요하지 않으면 데이터를 압축하지 마십시오 (이 경우에는 rsync와 같은 응용 프로그램에 투명한 디스크 기반 압축을 사용하십시오).
컴퓨터 (또는 디스크)를 도난 당하거나 분실 한 경우 데이터의 개인 정보를 보호해야하는 경우가 아니면 데이터를 암호화하지 마십시오. 데이터, 특히 암호화 키 또는 복구 키의 백업을 유지하십시오. 또한 전체 디스크 암호화는 rsync 성능에 가장 해로운 영향을 줄 수 있지만 하드 디스크 오류 및 데이터 백업을 사용할 수 없거나 백업을하지 않고 OS를 다시 설치하면 심각한 데이터 손실이 발생할 수 있습니다. 다른 데이터 디스크 / 파티션의 복구 키)
위의 내용은 관련 비 압축 / 언시 텐트 파일이 상당수의 데이터를 변경하지 않은 채 일부 편집 또는 추가를 통해 때때로 부분적으로 변경 될 수 있다고 가정합니다.
답변
하나의 파일 만 재 동기화하고 해당 파일이 암호화 또는 압축 된 경우 변경하지 않는 경우 파일을 전혀 전송할 필요가없는 대역폭 만 절약 할 수 있습니다.
그러나 ZIP 또는 JPEG 또는 GPG 파일로 가득 찬 디렉토리가있는 경우 rsync는 여전히 변경된 파일 만 전송하므로 새 파일 만 쉽게 전송할 수 있습니다.
참고 : 가능하면 압축되지 않은 데이터를 재 동기화하고 필요한 경우 링크의 양쪽에 저장하기 위해 압축하는 것이 유용하다는 것을 알았습니다. 이러한 방식으로 전송 대역폭을 절약 할 수 있습니다. 즉 :
mkdir /tmp/torsync
cd /tmp/torsync
unzip /home/me/somefile.zip
rsync -avz . remote:/tmp/somefile
ssh remote 'zip -r somefile.zip /tmp/somefile'
물론 YMMV.
OT : 백업 옵션을 사용하면 교체 된 파일의 백업 사본을 생성하여 기록 사본을 쉽게 검색 할 수 있으므로 대역폭을 절약하지 않아도 rsync가 유용하다는 것을 알았습니다.
후속 조치 : 이것은 압축 또는 암호화가 관련된 모든 형식에 적용되지만 Mathematica 사용자에게는 익숙하지 않습니다.