JSONL-samenvoeger
Combineer meerdere JSONL (JSON Lines)-bestanden tot één bestand. Herorden, dedupliceer en valideer regels. 100% aan clientzijde, je gegevens verlaten nooit je browser.
Invoerbestanden
Sleep .jsonl-bestanden hierheen, of klik om meerdere bestanden te selecteren
Ondersteunt .jsonl, .ndjson, .json, .txt
Samenvoegopties
Invoerbestanden
Sleep .jsonl-bestanden hierheen, of klik om meerdere bestanden te selecteren
Ondersteunt .jsonl, .ndjson, .json, .txt
Samenvoegopties
Samengevoegde uitvoer
Sleep of selecteer JSONL-bestanden om samen te voegen
Hoe JSONL-bestanden samenvoegen
Selecteer of sleep meerdere JSONL-bestanden naar het uploadgebied. Elk bestand wordt volledig in je browser gelezen — er worden geen gegevens naar een server verzonden. Bestanden kunnen in .jsonl-, .ndjson-, .json- of .txt-formaat zijn.
Eenmaal geüpload kun je bestanden herordenen met de omhoog/omlaag-pijlen om de samenvoegvolgorde te bepalen. Schakel deduplicatie in om dubbele regels te verwijderen op basis van hun volledige inhoud, of schakel JSON-validatie in om regels over te slaan die geen geldige JSON zijn.
De samengevoegde uitvoer verschijnt in het voorbeeldpaneel dat de eerste 100 regels toont. Download het volledige samengevoegde bestand als een .jsonl-bestand of kopieer het naar je klembord. Statistieken tonen het totale regelnummer, de bestandsgrootte en eventuele verwijderde duplicaten of ongeldige regels.
Wat is JSONL samenvoegen?
JSONL samenvoegen is het proces van het combineren van meerdere JSONL (JSON Lines)-bestanden tot één bestand. Elk invoerbestand bevat één JSON-object per regel, en de samenvoeger voegt alle regels uit alle bestanden samen in één uitvoerbestand met behoud van de door jou opgegeven volgorde.
Dit is essentieel bij het werken met datasets die over meerdere bestanden zijn verdeeld — zoals trainingsdata-shards, dagelijkse logexports of opgedeelde API-responses. Samenvoegen consolideert ze in één bestand voor eenvoudigere verwerking, analyse of upload naar platforms die een enkel JSONL-invoerbestand verwachten.
Veelvoorkomende gebruiksscenario's
Dataset-consolidatie
Combineer meerdere JSONL-trainingsdata-shards tot één bestand voor upload naar OpenAI fine-tuning, Hugging Face of andere ML-platforms.
Datapipeline-assemblage
Voeg uitvoerbestanden van parallelle dataverwerkingspipelines samen tot één JSONL-bestand voor downstream consumptie.
ML-trainingsdata voorbereiden
Consolideer prompt-completion paren uit meerdere bronnen tot één JSONL-bestand dat klaar is voor model fine-tuning.
Logbestandaggregatie
Combineer dagelijkse of uurlijkse JSONL-logexports tot één bestand voor uitgebreide loganalyse en zoekopdrachten.
Teamsamenwerking
Voeg JSONL-databestanden van verschillende teamleden samen tot een uniforme dataset voor gedeelde analyse.
Analysedata samenvoegen
Combineer JSONL-eventdata van meerdere diensten of tijdsperioden voor uniforme analyse en rapportage.
Veelvoorkomende fouten & oplossingen
Dubbele records in bestanden
Bij het samenvoegen van overlappende JSONL-exports (bijv. dagelijkse logs met overlappende tijdstempels) kunnen duplicaten voorkomen. Schakel de optie 'Duplicaten verwijderen' in om automatisch te dedupliceren op basis van exacte regelinhoud. Voor semantische deduplicatie (dezelfde data, andere opmaak) formatteer je eerst alle bestanden consistent met de JSONL Formatter.
Gemengde codering tussen bestanden
Bestanden uit verschillende bronnen kunnen verschillende tekencoderingen gebruiken (UTF-8, UTF-8 met BOM, Windows-1252). Dit kan ervoor zorgen dat de eerste regel van sommige bestanden niet goed wordt geparseerd. Zorg ervoor dat alle bestanden als UTF-8 zonder BOM zijn opgeslagen voor het samenvoegen.
Inconsistente schema's in bestanden
JSONL-bestanden uit verschillende bronnen kunnen verschillende sleutelstructuren hebben. Hoewel de samenvoeger bestanden combineert ongeacht schemaverschillen, verwachten downstream tools mogelijk consistente schema's. Valideer je samengevoegde uitvoer met de JSONL Validator om te controleren of elke regel geldige JSON is.
Veelgestelde vragen
Hoe combineert de merger meerdere JSONL-bestanden?
Ja. Alle samenvoegbewerkingen gebeuren lokaal in je browser. Er worden geen bestandsgegevens naar een server geüpload. Je JSONL-bestanden verlaten nooit je apparaat.
Hoe werkt het verwijderen van duplicaten?
Er is geen vaste limiet op het aantal bestanden. Je kunt zoveel JSONL-bestanden toevoegen als nodig. Aangezien alle bestanden in het browsergeheugen worden geladen, kunnen zeer grote gecombineerde datasets (enkele honderden MB) trager zijn afhankelijk van je apparaat.
Upload deze JSONL-merger mijn bestanden?
Deduplicatie vergelijkt de volledige getrimde inhoud van elke regel. Als twee regels identiek zijn (dezelfde tekens, dezelfde volgorde), wordt het tweede exemplaar verwijderd. Dit is exacte-match deduplicatie — regels met dezelfde data maar andere sleutelvolgorde of witruimte worden als verschillend behandeld.
Werkt deze tool ook voor NDJSON-bestanden?
Ja. Na het uploaden gebruik je de omhoog- en omlaag-pijlknoppen naast elk bestand om ze te herordenen. De samengevoegde uitvoer volgt de bestandsvolgorde van boven naar beneden.
Hoeveel bestanden kan ik tegelijk samenvoegen?
Lege regels en regels die alleen witruimte bevatten worden automatisch uitgefilterd bij het lezen van bestanden. Ze verschijnen niet in de samengevoegde uitvoer. Dit volgt de JSONL-specificatie waarbij lege regels worden genegeerd.
Hoe splits ik een samengevoegd bestand weer op?
Ja. De samenvoeger combineert bestanden ongeacht schemaverschillen. Elke regel wordt exact behouden zoals deze is. Als je schemaconsistentie nodig hebt, valideer of transformeer de bestanden dan individueel voor het samenvoegen.
Blijft de regelvolgorde behouden bij samenvoegen?
Ja. Regels binnen elk bestand behouden hun oorspronkelijke volgorde. Bestanden worden samengevoegd in de volgorde die in de bestandslijst wordt weergegeven. Je kunt de bestandsvolgorde aanpassen voor het samenvoegen.
Kan ik bestanden met verschillende schema's samenvoegen?
Deze tool biedt een visuele interface met drag-and-drop upload, bestandsherordening, deduplicatie, JSON-validatie, regeltelstatistieken en direct voorvertoning. In tegenstelling tot handmatige samenvoeging met cat of copy-opdrachten worden randgevallen zoals afsluitende nieuwe regels en lege regels automatisch afgehandeld.