Skip to content

Commit

Permalink
Update readme
Browse files Browse the repository at this point in the history
  • Loading branch information
animan01 committed Jun 28, 2020
1 parent 81e0f42 commit 3adb611
Show file tree
Hide file tree
Showing 3 changed files with 9 additions and 1 deletion.
2 changes: 2 additions & 0 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -8,6 +8,8 @@ Find duplicates in CSV file. The problem was the related search for duplicates i

Union find algorithm implemented on PHP, finding a chain of duplicates and generates result with **ID** and **PARENT_ID** was created.

Since there were no similar implementations of Union find algorithm, it was decided to write it yourself on PHP.

Example of input data (based on the csv file):
```
ID,PARENT_ID,EMAIL,CARD,PHONE,TMP
Expand Down
6 changes: 5 additions & 1 deletion README_RU.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,11 @@ Alhoritm

Problem/Motivation
--
Поиск дубликатов в CSV файле. Суть задачи состояла в связанном поиска дубликатов в таблице с данными. По требованиям нужно найти из ключевых полей дубликат (в любом поле) и присвоить записи **PARENT_ID** первого вхождения дубликата. Было решено использовать **Union find**, алгоритм который реализовали на PHP находит дубликаты связывает их и формирует результат с **ID** и **PARENT_ID**.
Поиск дубликатов в CSV файле. Суть задачи состояла в связанном поиска дубликатов в таблице с данными. По требованиям нужно найти из ключевых полей дубликат (в любом поле) и присвоить записи **PARENT_ID** первого вхождения дубликата.

Было решено использовать **Union find**, алгоритм который реализовали на PHP находит дубликаты связывает их и формирует результат с **ID** и **PARENT_ID**.

Поскольку реализаций данного алгоритма в сети не было, было принято решение написать свою реализацию **Union find** алгоритма на PHP.

Пример входных данных (за основу взят файл csv):
```
Expand Down
2 changes: 2 additions & 0 deletions README_UA.md
Original file line number Diff line number Diff line change
Expand Up @@ -8,6 +8,8 @@ Problem/Motivation

Вирішено було використати **Union find** алгоритм написаний на PHP який знаходить дублікати зв'язує їх і формує результат з **ID** та **PARENT_ID**.

Оскільки реалізацій даного алгоритму в мережі не було, було прийнято рішення написати свою реалізацію **Union find** алгоритму на PHP.

Приклад вхідних даних (за основу взятий файл csv):
```
ID,PARENT_ID,EMAIL,CARD,PHONE,TMP
Expand Down

0 comments on commit 3adb611

Please sign in to comment.