Fusionador JSONL

Combina múltiples archivos JSONL (JSON Lines) en un solo archivo. Reordena, deduplica y valida líneas. 100% del lado del cliente, tus datos nunca salen de tu navegador.

Archivos de entrada

Arrastra archivos .jsonl aquí, o haz clic para seleccionar múltiples archivos

Compatible con .jsonl, .ndjson, .json, .txt

Opciones de fusión

Cómo fusionar archivos JSONL

Selecciona o arrastra y suelta múltiples archivos JSONL en el área de subida. Cada archivo se lee completamente en tu navegador — no se envían datos a ningún servidor. Los archivos pueden estar en formato .jsonl, .ndjson, .json o .txt.

Una vez subidos, puedes reordenar los archivos usando las flechas arriba/abajo para controlar el orden de fusión. Activa la deduplicación para eliminar líneas duplicadas basándose en su contenido completo, o activa la validación JSON para omitir líneas que no sean JSON válido.

La salida fusionada aparece en el panel de vista previa mostrando las primeras 100 líneas. Descarga el archivo fusionado completo como un archivo .jsonl o cópialo a tu portapapeles. Las estadísticas muestran el conteo total de líneas, tamaño del archivo y cualquier duplicado o línea inválida eliminada.

¿Qué es la fusión de JSONL?

La fusión de JSONL es el proceso de combinar múltiples archivos JSONL (JSON Lines) en un solo archivo. Cada archivo de entrada contiene un objeto JSON por línea, y el fusionador concatena todas las líneas de todos los archivos en un archivo de salida preservando el orden que especifiques.

Esto es esencial cuando se trabaja con datasets divididos en múltiples archivos — como fragmentos de datos de entrenamiento, exportaciones diarias de logs o respuestas de API en fragmentos. La fusión los consolida en un solo archivo para un procesamiento, análisis o subida más fácil a plataformas que esperan una única entrada JSONL.

Casos de uso comunes

Consolidación de datasets

Combina múltiples fragmentos de datos de entrenamiento JSONL en un solo archivo para subir a fine-tuning de OpenAI, Hugging Face u otras plataformas ML.

Ensamblaje de pipelines de datos

Fusiona archivos de salida de pipelines de procesamiento de datos paralelos en un solo archivo JSONL para consumo posterior.

Preparación de datos de entrenamiento ML

Consolida pares de prompt-completion de múltiples fuentes en un solo archivo JSONL listo para fine-tuning de modelos.

Agregación de archivos de log

Combina exportaciones de logs JSONL diarias u horarias en un solo archivo para análisis y búsqueda integral de logs.

Colaboración en equipo

Fusiona archivos de datos JSONL contribuidos por diferentes miembros del equipo en un dataset unificado para análisis compartido.

Fusión de datos de análisis

Combina datos de eventos JSONL de múltiples servicios o períodos de tiempo para análisis y reportes unificados.

Errores comunes y soluciones

Registros duplicados entre archivos

Al fusionar exportaciones JSONL superpuestas (ej., logs diarios con timestamps superpuestos), pueden ocurrir duplicados. Activa la opción 'Eliminar duplicados' para deduplicar automáticamente basándose en el contenido exacto de la línea. Para deduplicación semántica (mismos datos, formato diferente), formatea todos los archivos de manera consistente primero usando el Formateador JSONL.

Codificación mixta entre archivos

Los archivos de diferentes fuentes pueden usar diferentes codificaciones de caracteres (UTF-8, UTF-8 con BOM, Windows-1252). Esto puede causar que la primera línea de algunos archivos falle al parsearse como JSON. Asegúrate de que todos los archivos estén guardados como UTF-8 sin BOM antes de fusionar.

Esquemas inconsistentes entre archivos

Los archivos JSONL de diferentes fuentes pueden tener diferentes estructuras de claves. Aunque el fusionador combina archivos independientemente de las diferencias de esquema, las herramientas posteriores pueden esperar esquemas consistentes. Valida tu salida fusionada con el Validador JSONL para asegurar que cada línea sea JSON válido.

Preguntas frecuentes

¿Cómo combina los archivos este fusionador JSONL?

Sí. Toda la fusión ocurre localmente en tu navegador. No se suben datos de archivos a ningún servidor. Tus archivos JSONL nunca salen de tu dispositivo.

¿Este fusionador JSONL puede eliminar líneas duplicadas?

No hay un límite estricto en el número de archivos. Puedes agregar tantos archivos JSONL como necesites. Sin embargo, dado que todos los archivos se cargan en la memoria del navegador, datasets combinados muy grandes (varios cientos de MB) pueden ser más lentos dependiendo de tu dispositivo.

¿Este fusionador JSONL sube mis datos?

La deduplicación compara el contenido completo recortado de cada línea. Si dos líneas son idénticas (mismos caracteres, mismo orden), la segunda ocurrencia se elimina. Esta es deduplicación de coincidencia exacta — líneas con los mismos datos pero diferente orden de claves o espacios en blanco se tratan como diferentes.

¿Puedo fusionar archivos NDJSON con esta herramienta?

Sí. Después de subir, usa los botones de flechas arriba y abajo junto a cada archivo para reordenarlos. La salida fusionada sigue el orden de archivos de arriba a abajo.

¿Cuántos archivos puedo fusionar a la vez?

Las líneas vacías y las líneas solo con espacios en blanco se filtran automáticamente durante la lectura de archivos. No aparecen en la salida fusionada. Esto sigue la especificación JSONL donde las líneas en blanco se ignoran.

¿Cómo divido un archivo JSONL fusionado de nuevo?

Sí. El fusionador combina archivos independientemente de las diferencias de esquema. Cada línea se preserva exactamente como está. Si necesitas consistencia de esquema, valida o transforma los archivos individualmente antes de fusionar.

¿El fusionador preserva el orden original de los archivos?

Sí. Las líneas dentro de cada archivo mantienen su orden original. Los archivos se concatenan en el orden mostrado en la lista de archivos. Puedes ajustar el orden de los archivos antes de fusionar.

¿Puedo fusionar archivos con diferentes esquemas?

Esta herramienta proporciona una interfaz visual con subida por arrastrar y soltar, reordenamiento de archivos, deduplicación, validación JSON, estadísticas de conteo de líneas y vista previa instantánea. A diferencia de la concatenación manual con comandos cat o copy, maneja automáticamente casos especiales como saltos de línea finales y líneas vacías.

JSONL splitter/validate JSONL/JSONL best practices/handling large JSONL files/JSONL viewer
Fusionador JSONL — Fusiona y deduplica archivos JSONL Onl...