стоит задача выполнить поиск дубликатов в текстовом файле размером около 50 Гб. строки длинной от 8 до 32 символов. Для начала просто найти дубликаты и показать их на экране. Как решить подобную задачу в приемлемый срок(до 48 часов) с использованием c#? пытался пробегать и сравнивать построчно, но это не для таких объёмов. Логика подсказывает что нужно файл разделить на M частей по N строк. считывать в память части и там их сравнивать. Но что-то мне подсказывает это вариант не сильно быстрее.
Но может существует какой-то другой вариант?