Как получить MD5 хеш файла в C++?
У меня есть путь к файлу. Как я могу получить хеш MD5 этого?
12 ответов
Вот прямая реализация md5sum
Команда, которая вычисляет и отображает MD5 файла, указанного в командной строке. Это должно быть связано с библиотекой OpenSSL (gcc md5.c -o md5 -lssl
) работать. Это чистый C, но вы должны достаточно легко адаптировать его к своему приложению C++.
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <openssl/md5.h>
unsigned char result[MD5_DIGEST_LENGTH];
// Print the MD5 sum as hex-digits.
void print_md5_sum(unsigned char* md) {
int i;
for(i=0; i <MD5_DIGEST_LENGTH; i++) {
printf("%02x",md[i]);
}
}
// Get the size of the file by its file descriptor
unsigned long get_size_by_fd(int fd) {
struct stat statbuf;
if(fstat(fd, &statbuf) < 0) exit(-1);
return statbuf.st_size;
}
int main(int argc, char *argv[]) {
int file_descript;
unsigned long file_size;
char* file_buffer;
if(argc != 2) {
printf("Must specify the file\n");
exit(-1);
}
printf("using file:\t%s\n", argv[1]);
file_descript = open(argv[1], O_RDONLY);
if(file_descript < 0) exit(-1);
file_size = get_size_by_fd(file_descript);
printf("file size:\t%lu\n", file_size);
file_buffer = mmap(0, file_size, PROT_READ, MAP_SHARED, file_descript, 0);
MD5((unsigned char*) file_buffer, file_size, result);
munmap(file_buffer, file_size);
print_md5_sum(result);
printf(" %s\n", argv[1]);
return 0;
}
Вы можете реализовать алгоритм MD5 самостоятельно (примеры доступны по всему Интернету) или можете ссылаться на библиотеки OpenSSL и использовать функции дайджеста OpenSSL. Вот пример, чтобы получить MD5 байтового массива:
#include <openssl/md5.h>
QByteArray AESWrapper::md5 ( const QByteArray& data) {
unsigned char * tmp_hash;
tmp_hash = MD5((const unsigned char*)data.constData(), data.length(), NULL);
return QByteArray((const char*)tmp_hash, MD5_DIGEST_LENGTH);
}
Для тех, кто перенаправлен с " https://stackru.com/questions/4393017/md5-implementation-in-c", поскольку он был неправильно помечен как дубликат.
Пример, расположенный здесь, работает:
http://www.zedwood.com/article/cpp-md5-function
Если вы компилируете в VC++2010, то вам нужно изменить его main.cpp следующим образом:
#include <iostream> //for std::cout
#include <string.h> //for std::string
#include "MD5.h"
using std::cout; using std::endl;
int main(int argc, char *argv[])
{
std::string Temp = md5("The quick brown fox jumps over the lazy dog");
cout << Temp.c_str() << endl;
return 0;
}
Вам придется немного изменить класс MD5, если вы хотите читать в массиве char * вместо строки, чтобы ответить на вопрос на этой странице здесь.
РЕДАКТИРОВАТЬ:
Видимо, изменение библиотеки MD5 неясно, так что решение Full VC++2010 здесь для вашего удобства, включая char *:
https://github.com/alm4096/MD5-Hash-Example-VS
Небольшое объяснение здесь:
#include <iostream> //for std::cout
#include <string.h> //for std::string
#include <fstream>
#include "MD5.h"
using std::cout; using std::endl;
int main(int argc, char *argv[])
{
//Start opening your file
ifstream inBigArrayfile;
inBigArrayfile.open ("Data.dat", std::ios::binary | std::ios::in);
//Find length of file
inBigArrayfile.seekg (0, std::ios::end);
long Length = inBigArrayfile.tellg();
inBigArrayfile.seekg (0, std::ios::beg);
//read in the data from your file
char * InFileData = new char[Length];
inBigArrayfile.read(InFileData,Length);
//Calculate MD5 hash
std::string Temp = md5(InFileData,Length);
cout << Temp.c_str() << endl;
//Clean up
delete [] InFileData;
return 0;
}
Я просто добавил следующее в библиотеку MD5:
MD5.cpp:
MD5::MD5(char * Input, long length)
{
init();
update(Input, length);
finalize();
}
MD5.h:
std::string md5(char * Input, long length);
QFile file("bigimage.jpg");
if (file.open(QIODevice::ReadOnly))
{
QByteArray fileData = file.readAll();
QByteArray hashData = QCryptographicHash::hash(fileData,QCryptographicHash::Md5); // or QCryptographicHash::Sha1
qDebug() << hashData.toHex(); // 0e0c2180dfd784dd84423b00af86e2fc
}
Мне нужно было сделать это прямо сейчас, и мне потребовалось кроссплатформенное решение, подходящее для C++11, boost и openssl. Я взял решение Д'Набра в качестве отправной точки и свел его к следующему:
#include <openssl/md5.h>
#include <iomanip>
#include <sstream>
#include <boost/iostreams/device/mapped_file.hpp>
const std::string md5_from_file(const std::string& path)
{
unsigned char result[MD5_DIGEST_LENGTH];
boost::iostreams::mapped_file_source src(path);
MD5((unsigned char*)src.data(), src.size(), result);
std::ostringstream sout;
sout<<std::hex<<std::setfill('0');
for(auto c: result) sout<<std::setw(2)<<(int)c;
return sout.str();
}
Исполняемый файл быстрого теста демонстрирует:
#include <iostream>
int main(int argc, char *argv[]) {
if(argc != 2) {
std::cerr<<"Must specify the file\n";
exit(-1);
}
std::cout<<md5_from_file(argv[1])<<" "<<argv[1]<<std::endl;
return 0;
}
Некоторые ссылки на заметки:
Linux: -lcrypto -lboost_iostreams
Окна: -DBOOST_ALL_DYN_LINK libeay32.lib ssleay32.lib
md5.h
Также есть MD5_*
функции очень полезны для большого файла
#include <openssl/md5.h>
#include <fstream>
.......
std::ifstream file(filename, std::ifstream::binary);
MD5_CTX md5Context;
MD5_Init(&md5Context);
char buf[1024 * 16];
while (file.good()) {
file.read(buf, sizeof(buf));
MD5_Update(&md5Context, buf, file.gcount());
}
unsigned char result[MD5_DIGEST_LENGTH];
MD5_Final(result, &md5Context);
Очень просто, не правда ли? Преобразование в строку также очень просто:
#include <sstream>
#include <iomanip>
.......
std::stringstream md5string;
md5string << std::hex << std::uppercase << std::setfill('0');
for (const auto &byte: result)
md5string << std::setw(2) << (int)byte;
return md5string.str();
Я использую этот файл http://people.csail.mit.edu/rivest/Md5.c
Я использовал Botan для выполнения этой и других операций раньше. АраК указал Crypto++. Я полагаю, что обе библиотеки совершенно корректны. Теперь это зависит от вас:-).
Используя Crypto++, вы можете сделать следующее:
#include <sha.h>
#include <iostream>
SHA256 sha;
while ( !f.eof() ) {
char buff[4096];
int numchars = f.read(...);
sha.Update(buff, numchars);
}
char hash[size];
sha.Final(hash);
cout << hash <<endl;
Мне нужно что-то очень похожее, потому что я не могу читать файлы размером в несколько гигабайт только для вычисления хэша. Теоретически я мог бы отобразить их в памяти, но я должен поддерживать 32-битные платформы - это все еще проблематично для больших файлов.
На http://256stuff.com/sources/md5/ есть симпатичная библиотека с примером использования. Это самая простая библиотека для MD5.
Доработка имплементации @D'Nabre для C++. Не забудьте скомпилировать с -lcrypto в конце: gcc md5.c -o md5 -lcrypto
,
#include <iostream>
#include <iomanip>
#include <fstream>
#include <string>
#include <openssl/md5.h>
using namespace std;
unsigned char result[MD5_DIGEST_LENGTH];
// function to print MD5 correctly
void printMD5(unsigned char* md, long size = MD5_DIGEST_LENGTH) {
for (int i=0; i<size; i++) {
cout<< hex << setw(2) << setfill('0') << (int) md[i];
}
}
int main(int argc, char *argv[]) {
if(argc != 2) {
cout << "Specify the file..." << endl;
return 0;
}
ifstream::pos_type fileSize;
char * memBlock;
ifstream file (argv[1], ios::ate);
//check if opened
if (file.is_open() ) { cout<< "Using file\t"<< argv[1]<<endl; }
else {
cout<< "Unnable to open\t"<< argv[1]<<endl;
return 0;
}
//get file size & copy file to memory
//~ file.seekg(-1,ios::end); // exludes EOF
fileSize = file.tellg();
cout << "File size \t"<< fileSize << endl;
memBlock = new char[fileSize];
file.seekg(0,ios::beg);
file.read(memBlock, fileSize);
file.close();
//get md5 sum
MD5((unsigned char*) memBlock, fileSize, result);
//~ cout << "MD5_DIGEST_LENGTH = "<< MD5_DIGEST_LENGTH << endl;
printMD5(result);
cout<<endl;
return 0;
}