Как создать контрольную сумму MD5 для файла в Android?
В моем приложении у меня есть требование для генерации контрольной суммы MD5 для файла. Не могли бы вы сказать мне, если есть какой-либо способ, которым это может быть достигнуто?
Спасибо.
17 ответов
Преобразуйте содержимое файла в строку и используйте следующий метод:
public static String getMD5EncryptedString(String encTarget){
MessageDigest mdEnc = null;
try {
mdEnc = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
System.out.println("Exception while encrypting to md5");
e.printStackTrace();
} // Encryption algorithm
mdEnc.update(encTarget.getBytes(), 0, encTarget.length());
String md5 = new BigInteger(1, mdEnc.digest()).toString(16);
while ( md5.length() < 32 ) {
md5 = "0"+md5;
}
return md5;
}
Обратите внимание, что этот простой подход подходит для небольших строк, но не будет эффективным для больших файлов. Для последнего см . Ответ dentex.
Этот код взят из CMupdater, из ПЗУ Android CyanogenMod 10.2. Он проверяет загруженные ПЗУ в приложение для обновления.
Отлично работает:
/*
* Copyright (C) 2012 The CyanogenMod Project
*
* * Licensed under the GNU GPLv2 license
*
* The text of the license can be found in the LICENSE file
* or at https://www.gnu.org/licenses/gpl-2.0.txt
*/
package com.cyanogenmod.updater.utils;
import android.text.TextUtils;
import android.util.Log;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
public class MD5 {
private static final String TAG = "MD5";
public static boolean checkMD5(String md5, File updateFile) {
if (TextUtils.isEmpty(md5) || updateFile == null) {
Log.e(TAG, "MD5 string empty or updateFile null");
return false;
}
String calculatedDigest = calculateMD5(updateFile);
if (calculatedDigest == null) {
Log.e(TAG, "calculatedDigest null");
return false;
}
Log.v(TAG, "Calculated digest: " + calculatedDigest);
Log.v(TAG, "Provided digest: " + md5);
return calculatedDigest.equalsIgnoreCase(md5);
}
public static String calculateMD5(File updateFile) {
MessageDigest digest;
try {
digest = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
Log.e(TAG, "Exception while getting digest", e);
return null;
}
InputStream is;
try {
is = new FileInputStream(updateFile);
} catch (FileNotFoundException e) {
Log.e(TAG, "Exception while getting FileInputStream", e);
return null;
}
byte[] buffer = new byte[8192];
int read;
try {
while ((read = is.read(buffer)) > 0) {
digest.update(buffer, 0, read);
}
byte[] md5sum = digest.digest();
BigInteger bigInt = new BigInteger(1, md5sum);
String output = bigInt.toString(16);
// Fill to 32 chars
output = String.format("%32s", output).replace(' ', '0');
return output;
} catch (IOException e) {
throw new RuntimeException("Unable to process file for MD5", e);
} finally {
try {
is.close();
} catch (IOException e) {
Log.e(TAG, "Exception on closing MD5 input stream", e);
}
}
}
}
У меня была та же задача, и этот код работает отлично:
public static String fileToMD5(String filePath) {
InputStream inputStream = null;
try {
inputStream = new FileInputStream(filePath);
byte[] buffer = new byte[1024];
MessageDigest digest = MessageDigest.getInstance("MD5");
int numRead = 0;
while (numRead != -1) {
numRead = inputStream.read(buffer);
if (numRead > 0)
digest.update(buffer, 0, numRead);
}
byte [] md5Bytes = digest.digest();
return convertHashToString(md5Bytes);
} catch (Exception e) {
return null;
} finally {
if (inputStream != null) {
try {
inputStream.close();
} catch (Exception e) { }
}
}
}
private static String convertHashToString(byte[] md5Bytes) {
String returnVal = "";
for (int i = 0; i < md5Bytes.length; i++) {
returnVal += Integer.toString(( md5Bytes[i] & 0xff ) + 0x100, 16).substring(1);
}
return returnVal.toUpperCase();
}
Вот небольшая чистая функция расширения kotlin. Хорошо работает и с большими файлами.
fun File.md5(): String {
val md = MessageDigest.getInstance("MD5")
return this.inputStream().use { fis ->
val buffer = ByteArray(8192)
generateSequence {
when (val bytesRead = fis.read(buffer)) {
-1 -> null
else -> bytesRead
}
}.forEach { bytesRead -> md.update(buffer, 0, bytesRead) }
md.digest().joinToString("") { "%02x".format(it) }
}
}
И юнит-тест для этого:
@Test
fun `computes md5 checksum correctly`() {
val file = File.createTempFile("test-", ".tmp")
// did md5 on unix machine to comfirm -- put a literal LF at end to compare
val content = "This is the content of a file." + 0x0a.toChar()
file.writer().use { w -> w.write(content) }
assertEquals("a149f5161e873921d84636b2a1b3aad2", file.md5())
}
Если вы используете Okio (который сегодня используется большинством приложений, прямо или косвенно с помощью OkHttp или Retrofit), вы также можете сделать что-то вроде этого:
return File(path).source().buffer().use { source ->
HashingSink.md5(blackholeSink()).use { sink ->
source.readAll(sink)
sink.hash.hex()
}
}
При этом не обязательно буферизовать весь файл в памяти (HashingSink
будет обновлять md5sum с каждым write
позвоните, а затем позвоните в blackholeSink()
, который ничего не делает с байтами). Вы также можете использоватьHashingSource
вместо этого сделать что-то подобное.
public static String getMd5OfFile(String filePath)
{
String returnVal = "";
try
{
InputStream input = new FileInputStream(filePath);
byte[] buffer = new byte[1024];
MessageDigest md5Hash = MessageDigest.getInstance("MD5");
int numRead = 0;
while (numRead != -1)
{
numRead = input.read(buffer);
if (numRead > 0)
{
md5Hash.update(buffer, 0, numRead);
}
}
input.close();
byte [] md5Bytes = md5Hash.digest();
for (int i=0; i < md5Bytes.length; i++)
{
returnVal += Integer.toString( ( md5Bytes[i] & 0xff ) + 0x100, 16).substring( 1 );
}
}
catch(Throwable t) {t.printStackTrace();}
return returnVal.toUpperCase();
}
Если вам нужно рассчитать MD5 большого файла, вы можете использовать это:
Импортировать:
import java.security.MessageDigest;
Метод:
private byte[] calculateMD5ofFile(String location) throws IOException, NoSuchAlgorithmException {
FileInputStream fs= new FileInputStream(location);
MessageDigest md = MessageDigest.getInstance("MD5");
byte[] buffer=new byte[bufferSize];
int bytes=0;
do{
bytes=fs.read(buffer,0,bufferSize);
if(bytes>0)
md.update(buffer,0,bytes);
}while(bytes>0);
byte[] Md5Sum = md.digest();
return Md5Sum;
}
Ссылка: https://docs.oracle.com/javase/7/docs/api/java/security/MessageDigest.html
Для преобразования байтового массива в шестнадцатеричный. использовать этот
public static String ByteArraytoHexString(byte[] bytes) {
StringBuilder hexString = new StringBuilder();
for (int i = 0; i < bytes.length; i++) {
String hex = Integer.toHexString(bytes[i] & 0xFF);
if (hex.length() == 1) {
hexString.append('0');
}
hexString.append(hex);
}
return hexString.toString();
}
Я нашел следующее, чтобы работать очень хорошо:
Process process = Runtime.getRuntime().exec("md5 "+fileLocation);
BufferedReader inputStream = new BufferedReader(new InputStreamReader(process.getInputStream()));
String result = inputStream.readLine().split(" ")[0];
Это называется встроенным md5
команда. Переменная fileLocation
должен быть установлен в местоположение файла. Конечно, я рекомендую создать здесь несколько проверок, чтобы проверить, существует ли файл.
Приятель попробуйте следующий код
MessageDigest md = MessageDigest.getInstance("MD5");
InputStream is = new FileInputStream("file.txt");
try {
is = new DigestInputStream(is, md);
// read stream to EOF as normal...
}
finally {
is.close();
}
byte[] digest = md.digest();
Этот метод работал для меня, на zip-файле 131MB. MD5 рассчитывает совпадения, рассчитанные для того же файла AccuHash ( http://www.accuhash.com/)
public static String calculateMD5(File updateFile) {
MessageDigest digest;
try {
digest = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
Log.e("calculateMD5", "Exception while getting Digest", e);
return null;
}
InputStream is;
try {
is = new FileInputStream(updateFile);
} catch (FileNotFoundException e) {
Log.e("calculateMD5", "Exception while getting FileInputStream", e);
return null;
}
byte[] buffer = new byte[8192];
int read;
try {
while ((read = is.read(buffer)) > 0) {
digest.update(buffer, 0, read);
}
byte[] md5sum = digest.digest();
BigInteger bigInt = new BigInteger(1, md5sum);
String output = bigInt.toString(16);
// Fill to 32 chars
output = String.format("%32s", output).replace(' ', '0');
return output;
} catch (IOException e) {
throw new RuntimeException("Unable to process file for MD5", e);
} finally {
try {
is.close();
} catch (IOException e) {
Log.e("calculateMD5", "Exception on closing MD5 input stream", e);
}
}
}
Версия Котлина:
fun File.getMD5Hash(path: String): ByteArray {
val md = MessageDigest.getInstance("MD5")
val stream: InputStream
stream = FileInputStream(this)
val buffer = ByteArray(8192)
var read: Int
while (stream.read(buffer).also { read = it } > 0) {
md.update(buffer, 0, read)
}
stream.close()
return md.digest()
}
public static String md5(String data) throws NoSuchAlgorithmException {
// Get the algorithm:
MessageDigest md5 = MessageDigest.getInstance("MD5");
// Calculate Message Digest as bytes:
byte[] digest = md5.digest(data.getBytes(StandardCharsets.UTF_8));
// Convert to 32-char long String:
return String.format("%032x", new BigInteger(1, digest));
}
fun md5(file: File): String {
val digest = MessageDigest.getInstance(MD5_ALGORITHM)
file.inputStream().buffered(BUFFER_SIZE).use { it.iterator().forEach(digest::update) }
return digest.digest().joinToString("") { "%02x".format(it) }
}
Я использую эти два расширения в Kotlin:
fun File.calcHash(algorithm: String = "MD5", bufferSize: Int = 1024): ByteArray {
this.inputStream().use { input ->
val buffer = ByteArray(bufferSize)
val digest = MessageDigest.getInstance(algorithm)
read@ while (true) {
when (val bytesRead = input.read(buffer)) {
-1 -> break@read
else -> digest.update(buffer, 0, bytesRead)
}
}
return digest.digest()
}
}
fun ByteArray.toHexString(): String {
return this.fold(StringBuilder()) { result, b -> result.append(String.format("%02X", b)) }.toString()
}
С OKio это однострочный:
val md5_as_hex_string = Okio.buffer(Okio.source(file).readByteString().md5().hex()
В Котлине
private fun calculateMd5(file: File): String {
val digest = MessageDigest.getInstance("MD5")
file.inputStream().buffered(8192).use { it.iterator().forEach(digest::update) }
return digest.digest().joinToString("") { "%02x".format(it) }.toUpperCase()
}
Вот мой полный рабочий код. Мне нужно найти повторяющиеся файлы с помощью контрольной суммы.
/**
* this method is used for create check Sum further process...
*
* @param models path of image.
* @param asyncTask asyncTask of activity
* @return return array of all files check sum.
* <p>
* before put BufferedInputStream
* with BufferedInputStream (buffer 8192) with Logs
* with BufferedInputStream (buffer 16384) with Logs
* with BufferedInputStream (buffer 4194304) with Logs
* with BufferedInputStream (buffer 32768) with Logs
* with BufferedInputStream (buffer 32768) without Logs(MD5)
* with BufferedInputStream (buffer 32768) without Logs (SHA-256)
*/
public static ArrayList<FileModel> generateCheckSum(ScanningListener scanningListener, ArrayList<FileModel> lstAllFile, AsyncTask asyncTask) {
FileInputStream fis;
MessageDigest md;
byte[] buffer;
int numOfBytesRead;
byte[] hash;
long startTime = System.currentTimeMillis();
for (FileModel s : lstAllFile) {
if (scanningListener != null)
scanningListener.onGoingProgress(lstAllFile.size(),lstAllFile.indexOf(s));
try {
if (asyncTask.isCancelled()) {
break;
}
fis = new FileInputStream(s.getFilePath());
md = MessageDigest.getInstance("MD5");
buffer = new byte[16384];//(1024*2048)
while ((numOfBytesRead = fis.read(buffer)) > 0) {
md.update(buffer, 0, numOfBytesRead);
}
hash = md.digest();
s.setChecksum(convertHashToString(hash));
CustomLog.error("path", String.valueOf(s.getFilePath()));
} catch (IOException ex) {
CustomLog.error("IOException", String.valueOf(ex));
} catch (NoSuchAlgorithmException ex) {
CustomLog.error("NoSuchAlgorithmException ", String.valueOf(ex));
}
}
long endTime = System.currentTimeMillis();
long totalTime = endTime - startTime;
CustomLog.error("Total Time : ", TimeUtils.getDateIn24HrsFormatInUTC(totalTime));
return lstAllFile;
}
convertHashToString (хэш)
/**
* this method is help for convert hash value into string file and return hash code.
*
* @param hash byte array.
* @return return string of hash code
*/
private static String convertHashToString(byte[] hash) {
StringBuilder returnVal = new StringBuilder();
for (byte md5Byte : hash) {
returnVal.append(Integer.toString((md5Byte & 0xff) + 0x100, 16).substring(1));
}
return returnVal.toString();
}
Этот метод даст вам хэш-карту всех заданных файлов.
Я пробовал много разных типов размера буфера, а также MD5 и SHA-1, которые вы можете увидеть в разделе комментариев.