Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
| Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
| pres:gerti:servico_de_desenvolvimento_de_sistemas_de_informacao:projetos:iago-dataflow [11/07/2025 00:06] – mfaquino | pres:gerti:servico_de_desenvolvimento_de_sistemas_de_informacao:projetos:iago-dataflow [09/09/2025 22:51] (atual) – mfaquino | ||
|---|---|---|---|
| Linha 177: | Linha 177: | ||
| **Geração de Resumo do Documento** | **Geração de Resumo do Documento** | ||
| - | Com o texto extraido do documento e OCR, é realizado a geração de um resumo do documento e salvo no campo do elasticsearch **summary, **o resumo é feito utilizando uma LLM \\ \\ - GPT-4.1-mini atráves do serviço da OpenAI do Azure \\ - llama3.3 atráves do [[https:// | + | Com o texto extraido do documento e OCR, é realizado a geração de um resumo do documento e salvo no campo do elasticsearch **summary, **o resumo é feito utilizando uma LLM \\ \\ - GPT-4.1-mini atráves do serviço da [[: |
| + | - llama3.3 atráves do [[https:// | ||
| O seguinte prompt é utilizado para gerar o resumo: | O seguinte prompt é utilizado para gerar o resumo: | ||
| Linha 204: | Linha 205: | ||
| **Geração de Resumo do Processo** | **Geração de Resumo do Processo** | ||
| - | Após realizado o resumo dos documentos de um processo, é realizado a geração do resumo do processo usando os resumos de documentos, o resultado é salvo em cada registro de documento no campo do elasticsearch **process_summary, | + | Após realizado o resumo dos documentos de um processo, é realizado a geração do resumo do processo usando os resumos de documentos, o resultado é salvo em cada registro de documento no campo do elasticsearch **process_summary, |
| + | - llama3.3 atráves do [[https:// | ||
| < | < | ||
| Linha 234: | Linha 236: | ||
| </ | </ | ||
| - | ==== | + | |
| + | ==== Carga de Dados ==== | ||
| Ao final o resultado do processamento é carregado no elasticsearch, | Ao final o resultado do processamento é carregado no elasticsearch, | ||
| - | {{https:// | + | {{https:// |
| ==== Pipeline no Airflow ==== | ==== Pipeline no Airflow ==== | ||
| Linha 248: | Linha 251: | ||
| {{https:// | {{https:// | ||
| + | |||
| + | ==== Processos Sigilosos ==== | ||
| + | |||
| + | Diariamente é executado a pipeline de verificação de documentos sigilosos: [[https:// | ||
| + | A verificação é realizada executando a seguinte query no Oracle, que retorna todos os processos que atualmente são sigilosos: | ||
| + | < | ||
| + | |||
| + | SELECT | ||
| + | | ||
| + | | ||
| + | FROM TCE_GO.PRO_AUTUACAO | ||
| + | WHERE INDR_BLOQUEIODOC_A IS NOT NULL | ||
| + | ORDER BY PROAUTU_ID DESC | ||
| + | |||
| + | </ | ||
| + | |||
| + | Caso seja encontrado algum desses processos no elasticsearch, | ||
| + | |||
| + | Os logs dos processos removidos são registrados no próprio Airflow, sendo possível acompanhar periodicamente os documentos processados pelos administradores da ferramenta, ou usuários apenas leitores: \\ A seguir um exemplo de log de um processo que foi removido por se tornar sigiloso: **202500047003283** | ||
| + | |||
| + | {{https:// | ||
| ==== Tabela de Controle ==== | ==== Tabela de Controle ==== | ||