Abstract:
|
Diante do avanço das tecnologias comunicacionais, expande-se o montante de conteúdo disponível online sob circunstâncias reconhecidas como gratuitas, não obstante, são expostas publicidades como meio de monetização. O tráfego gerado por esse fluxo adicional pode propiciar sobrecarga nos enlaces e custos adicionais de franquias, estabelecendo interesse na determinação da parcela que esse compõe do todo, entretanto, em virtude da adoção de protocolos cifrados, à exemplo do YouTube com o QUIC, essa inspeção é dificultada. Sob esse pretexto desenvolveu-se neste trabalho meios de discernir as informações publicitárias difundidas dos conteúdos efetivamente requisitados, através de algoritmos de classificação e uso de inteligência artificial. Como resultado das capturas simuladas, foram obtidas médias de 9,60% de propaganda, com um desvio padrão de 7,41%. Além disso, o modelo Random Forest apresentou uma acurácia de 99% no conjunto de dados gerado, embora seja necessário validar esses resultados em datasets mais extensos. |