Divisor JSONL

Divida arquivos JSONL (JSON Lines) grandes em partes menores por número de linhas ou tamanho de arquivo. 100% no lado do cliente, seus dados nunca saem do seu navegador.

Entrada JSONL

Arraste um arquivo .jsonl aqui, ou clique para procurar

Suporta .jsonl, .ndjson, .json, .txt

Opções de Divisão

Como Dividir Arquivos JSONL

Envie seu arquivo JSONL grande ou cole seu conteúdo na área de entrada. A ferramenta aceita arquivos .jsonl, .ndjson, .json e .txt de qualquer tamanho.

Escolha como deseja dividir: por número de linhas (ex.: 1000 linhas por arquivo) ou por tamanho de arquivo (ex.: 10 MB por arquivo). O divisor processa cada linha independentemente, preservando a integridade de cada registro JSON.

Uma vez dividido, baixe cada parte individualmente ou use 'Baixar Tudo como ZIP' para obter todas as partes em um único arquivo. Cada arquivo de saída é um arquivo JSONL válido pronto para uso imediato.

O que é Divisão de JSONL?

Divisão de JSONL é o processo de dividir um arquivo JSONL (JSON Lines) grande em múltiplos arquivos menores, cada um contendo um subconjunto dos registros originais. Como cada linha em um arquivo JSONL é um objeto JSON independente, a divisão é simples e nunca quebra nenhum registro.

Isso é essencial ao trabalhar com plataformas de aprendizado de máquina que têm limites de tamanho de upload, APIs em lote que aceitam um número máximo de registros por requisição, ou pipelines de dados que funcionam melhor com arquivos de entrada menores. A divisão permite processar dados em partes gerenciáveis sem modificar o conteúdo.

Casos de Uso Comuns

Limites da Batch API da OpenAI

Divida arquivos JSONL grandes para atender aos limites de tamanho da Batch API da OpenAI (100 MB por arquivo, 50.000 requisições por lote).

Particionamento de Dados de Treinamento ML

Divida grandes datasets de treinamento em divisões treino/validação/teste ou partes de tamanho igual para treinamento distribuído.

Processamento Paralelo

Divida arquivos JSONL em partes para processamento paralelo em múltiplos workers, threads ou funções serverless.

Limites de Tamanho de Upload

Quebre grandes exportações JSONL em arquivos menores que caibam nos limites de upload da plataforma (multipart do AWS S3, GitHub, anexos de e-mail).

Carregamento Incremental de Dados

Divida grandes datasets em lotes menores para carregamento incremental em bancos de dados ou data warehouses para evitar timeouts.

Amigável para Controle de Versão

Divida arquivos de dados JSONL massivos em partes menores para controle de versão Git, evitando avisos de arquivos grandes e melhorando a legibilidade dos diffs.

Erros Comuns e Soluções

Divisão Produz Arquivos Vazios

Isso pode acontecer se o valor de linhas por arquivo for maior que o número total de linhas. Reduza o número de linhas por arquivo, ou use divisão baseada em tamanho em vez disso.

Divisão por Tamanho Produz Partes Desiguais

Ao dividir por tamanho, a última parte pode ser menor que o tamanho alvo porque as linhas nunca são quebradas no meio de um registro. Cada arquivo é garantido conter apenas linhas JSON completas.

Navegador Fica Lento com Arquivos Muito Grandes

Para arquivos acima de 500 MB, o navegador pode ficar lento durante o processamento. Considere dividir o arquivo usando ferramentas de linha de comando como 'split' ou 'wc -l' para datasets extremamente grandes, e depois use esta ferramenta para verificação.

Perguntas Frequentes

Como o divisor divide o arquivo JSONL?

Sim. Toda a divisão acontece localmente no seu navegador usando JavaScript. Nenhum dado é enviado para nenhum servidor. Seu conteúdo JSONL nunca sai do seu dispositivo.

Posso dividir por tamanho de arquivo?

Não há limite rígido. O divisor pode lidar com arquivos de várias centenas de megabytes. O desempenho depende do navegador e da memória do seu dispositivo.

Este divisor JSONL faz upload do meu arquivo?

Sim. Os registros são divididos sequencialmente. O primeiro arquivo contém as primeiras N linhas, o segundo arquivo contém as próximas N linhas, e assim por diante. Nenhum registro é reordenado ou duplicado.

Qual convenção de nomenclatura os arquivos divididos usam?

Atualmente, você pode escolher um modo de divisão por vez. Se precisar de ambas as restrições, divida pelo mais restritivo primeiro e depois verifique se os arquivos resultantes atendem a ambos os requisitos.

O divisor funciona com arquivos NDJSON?

Linhas vazias são preservadas durante a divisão. Se seu arquivo JSONL tiver linhas vazias entre os registros, elas aparecerão nos arquivos de saída em suas posições originais. Use nosso Validador JSONL para limpar linhas vazias antes de dividir, se necessário.

Posso juntar os arquivos divididos de volta?

Sim. Como cada arquivo dividido é um arquivo JSONL válido, você pode concatená-los para reconstruir o original. Na linha de comando, use 'cat part_*.jsonl > merged.jsonl'. Você também pode usar nossas ferramentas JSONL para combinar arquivos.

Qual o tamanho máximo de arquivo suportado?

Os arquivos divididos são nomeados com um número de parte sequencial (ex.: part_001.jsonl, part_002.jsonl). Ao baixar como ZIP, todas as partes são incluídas em um único arquivo.

A divisão preserva a ordem das linhas?

A divisão baseada em tamanho acumula linhas até que o limite de tamanho alvo seja atingido. O arquivo atual é fechado e um novo começa com a próxima linha. As linhas nunca são divididas entre arquivos, então cada parte pode estar ligeiramente acima ou abaixo do tamanho alvo.

JSONL merger/OpenAI Batch API JSONL format/large JSONL files guide/JSONL validator/online JSONL tools
Divisor JSONL — Divida Arquivos JSONL Grandes por Linhas ...