Há uma preocupação generalizada de que as câmeras de vídeo usarão o software de reconhecimento facial para rastrear todos os nossos movimentos públicos. Muito menos comentado – mas igualmente alarmante – é a expansão exponencial das redes de vigilância por vídeo “inteligentes”.
Empresas e residências particulares estão começando a conectar suas câmeras nas redes policiais, e os rápidos avanços na inteligência artificial estão investindo em redes de televisão em circuito fechado, ou CCTV, com poder de vigilância pública total. Em um futuro não tão distante, forças policiais, lojas e administradores da cidade esperam filmar cada movimento seu – e interpretá-lo usando a análise de vídeo.
O surgimento de redes de câmeras inteligentes que tudo vê é um desenvolvimento alarmante que ameaça direitos e liberdades civis em todo o mundo. As agências policiais têm um longo histórico de uso da vigilância contra comunidades marginalizadas e estudos mostram que a vigilância reduz a liberdade de expressão – efeitos nocivos que podem se espalhar à medida que as redes de câmeras se tornam maiores e mais sofisticadas.
Para entender a situação que estamos enfrentando, precisamos entender a ascensão do complexo industrial de videovigilância – sua história, seus players de força e sua trajetória futura. Começa com a proliferação de câmeras para polícia e segurança e termina com um poderoso novo imperativo da indústria: vigilância visual completa do espaço público.
Sistemas de gerenciamento de vídeo e redes de vigilância plug-in
Nas primeiras décadas de existência, as câmeras de CFTV eram dispositivos analógicos de baixa resolução gravados em fitas. Empresas ou autoridades da cidade os implantaram para filmar uma pequena área de interesse. Poucas câmeras foram colocadas em público, e o poder de rastrear pessoas era limitado: se a polícia quisesse perseguir uma pessoa de interesse, eles teriam que passar horas coletando imagens a pé de locais próximos.
No final dos anos 90, a vigilância por vídeo tornou-se mais avançada. Uma empresa chamada Axis Communications inventou a primeira câmera de vigilância via Internet, que converteu imagens em movimento em dados digitais. Novos negócios, como a Milestone Systems, criaram o Video Management Systems, ou VMS, para organizar informações de vídeo em bancos de dados. Os provedores de VMS criaram novos recursos, como a tecnologia de sensor de movimento, que alertava os guardas quando uma pessoa era pega na câmera em uma área restrita.
Com o passar do tempo, a vigilância por vídeo se espalhou. Por um lado, cerca de 50 anos atrás, o Reino Unido tinha em algum lugar ao norte de 60 câmeras de CFTV permanentes instaladas em todo o país. Hoje, o Reino Unido possui mais de 6 milhões de dispositivos, enquanto os EUA têm dezenas de milhões. De acordo com a empresa de marketing IHS Markit, 1 bilhão de câmeras estará assistindo o mundo até o final de 2021, com os Estados Unidos rivalizando com a taxa de penetração de câmeras por pessoa da China. A polícia agora pode rastrear pessoas através de várias câmeras a partir de um centro de comando e controle, desktop ou smartphone.
Embora seja possível conectar milhares de câmeras em um VMS, também é caro. Para aumentar a quantidade de CFTVs disponíveis, as cidades criaram recentemente um truque inteligente: incentivar empresas e moradores a colocar câmeras de propriedade privada em sua rede policial – o que eu chamo de “redes de vigilância plug-in”.
Nas últimas semanas, um protesto público explodiu sobre o reconhecimento facial programa empregado em conjunto com a rede de câmeras. (Brittany Greeson / The New York Times) Vídeo de câmeras de vigilância da cidade é exibido no Real-Time Crime Center, o espaço de visualização do Project Green Light, na sede do departamento de polícia de Detroit, em 14 de junho de 2019.
Ao agrupar câmeras pertencentes à cidade por câmeras particulares, especialistas em policiamento dizem que uma agência em uma cidade grande típica pode acumular centenas de milhares de feeds de vídeo em apenas alguns anos.
Detroit popularizou as redes de vigilância plug-in através do seu controverso programa Project Green Light. Com o Project Green Light, as empresas podem comprar câmeras de CFTV e conectá-las à sede da polícia. Eles também podem colocar uma luz verde brilhante ao lado das câmeras para indicar que fazem parte da rede policial. O projeto alega deter o crime, sinalizando aos moradores: A polícia está observando você.
Detroit não está sozinho.
Chicago, Nova Orleans, Nova York e Atlanta também implantaram redes de vigilância de plug-in. Nessas cidades, empresas privadas e / ou residências fornecem feeds integrados aos centros criminais, para que a polícia possa acessar transmissões ao vivo e imagens gravadas. O departamento de polícia de New Haven, Connecticut, me disse que eles estão investigando a vigilância por plug-in, e outros provavelmente estão considerando isso.
O número de câmeras nas redes policiais agora varia de dezenas de milhares (Chicago) a várias centenas (Nova Orleans). Com tantas câmeras instaladas e apenas uma pequena equipe de policiais para assisti-las, as agências policiais enfrentam um novo desafio: como você entende todas essas filmagens?
Por volta de 2006, uma jovem israelense estava gravando vídeos de família todo fim de semana, mas como estudante e mãe, não teve tempo de assisti-los. Um cientista da computação de sua universidade, o professor Shmuel Peleg, disse que tentou criar uma solução para ela: ele gravava um vídeo longo e condensava a atividade interessante em um pequeno videoclipe.
A solução dele falhou: funcionou apenas em câmeras fixas, e a câmera de vídeo da estudante estava em movimento quando ela filmou sua família.
Peleg logo encontrou outro caso de uso no setor de vigilância, que depende de câmeras estacionárias. Sua solução se tornou a BriefCam, uma empresa de análise de vídeo que pode resumir imagens de vídeo de uma cena ao longo do tempo, para que os investigadores possam ver todas as imagens relevantes em um curto espaço de tempo.
O BriefCam sobrepõe imagens de eventos que acontecem em momentos diferentes, como se eles estivessem aparecendo simultaneamente. Por exemplo, se várias pessoas passarem pela câmera às 12:30, 12:40 e 12:50, o BriefCam agregará suas imagens em uma única cena. Os investigadores podem visualizar todas as imagens de interesse de um determinado dia em minutos, em vez de horas.
Graças aos rápidos avanços na inteligência artificial, o resumo é apenas um recurso da linha de produtos da BriefCam e da indústria de análise de vídeo em rápida expansão.
O reconhecimento de comportamento inclui recursos de análise de vídeo como detecção de brigas, reconhecimento de emoções, detecção de quedas, vadias, passear com cães, passear de cavalo, sonegação de pedágio e até detecção de mentiras.
O reconhecimento de objetos pode reconhecer rostos, animais, carros, armas, incêndios e outras coisas, além de características humanas como sexo, idade e cor do cabelo.
A detecção de comportamento anômalo ou incomum funciona registrando uma área fixa por um período de tempo – digamos, 30 dias – e determinando o comportamento “normal” para aquela cena. Se a câmera vir algo incomum – digamos, uma pessoa correndo pela rua às 3:00 da manhã -, sinalizará o incidente por atenção.
Os sistemas de análise de vídeo podem analisar e pesquisar em fluxos em tempo real ou imagens gravadas. Eles também podem isolar indivíduos ou objetos enquanto atravessam uma rede de câmeras inteligentes.
Chicago; Nova Orleans; Detroit; Springfield, Massachusetts; e Hartford, Connecticut, são algumas das cidades que atualmente usam o BriefCam para policiar.
Com espaços urbanos cobertos por câmeras e análises de vídeo para compreendê-los, as agências policiais ganham a capacidade de gravar e analisar tudo, o tempo todo. Isso fornece às autoridades o poder de indexar e pesquisar um vasto banco de dados de objetos, comportamentos e atividades anômalas.
Em Connecticut, a polícia usou análise de vídeo para identificar ou monitorar traficantes de drogas conhecidos ou suspeitos. O sargento Johnmichael O’Hare, ex-diretor do Centro de Crimes em Tempo Real de Hartford, demonstrou recentemente como o BriefCam ajudou a polícia de Hartford a revelar “para onde as pessoas vão mais” no espaço de 24 horas, vendo imagens condensadas e resumidas em apenas nove minutos. Usando um recurso chamado “caminhos”, ele descobriu centenas de pessoas visitando apenas duas casas na rua e garantiu um mandado de busca para verificar se eram casas de drogas.
A startup de análise de vídeo Voxel51 também está adicionando pesquisas mais sofisticadas ao mix. Co-fundada por Jason Corso, professor de engenharia elétrica e ciência da computação na Universidade de Michigan, a empresa oferece uma plataforma para processamento e entendimento de vídeo.
Corso me disse que sua empresa espera oferecer o primeiro sistema em que as pessoas podem “pesquisar com base no conteúdo semântico de seus dados, como ‘Quero encontrar todos os videoclipes que tenham mais de três interseções de três vias … com pelo menos 20 veículos durante o dia. ”” O Voxel51 “tenta tornar isso possível” gravando vídeos e “transformando-os em dados pesquisáveis estruturados em diferentes tipos de plataformas”.
Ao contrário do BriefCam, que analisa vídeo usando nada além de seu próprio software, o Voxel51 oferece uma plataforma aberta que permite que terceiros adicionem seus próprios modelos de análise. Se a plataforma for bem-sucedida, sobrecarregará a capacidade de pesquisar e vigiar espaços públicos.
Corso me disse que sua empresa está trabalhando em um projeto piloto com a polícia de Baltimore para o seu programa de vigilância CitiWatch e planeja testar o software com o Departamento de Polícia de Houston.
À medida que as cidades começam a implantar uma ampla gama de dispositivos de monitoramento a partir da chamada Internet das Coisas, os pesquisadores também estão desenvolvendo uma técnica conhecida como análise de vídeo e fusão de sensores, ou VA / SF, para inteligência policial. Com o VA / SF, vários fluxos de sensores são combinados com análises de vídeo para reduzir incertezas e fazer inferências sobre situações complexas. Como exemplo, Peleg me disse que o BriefCam está desenvolvendo análises de áudio na câmera que usam microfones para discernir ações que podem confundir os sistemas de IA, como se as pessoas estão brigando ou dançando.
Os VMSs também oferecem integração inteligente entre tecnologias. O ex-chefe de polícia de New Haven, Anthony Campbell, contou-me como os ShotSpotters, dispositivos polêmicos que escutam tiros, se integram a software especializado. Quando uma arma é disparada, as câmeras giratórias próximas alteram instantaneamente sua direção para o local da descarga das armas.
Os policiais também podem usar o software para trancar as portas do prédio de um centro de controle, e as empresas estão desenvolvendo análises para alertar a segurança se um carro estiver sendo seguido por outro.
Rumo a um mundo “Minority Report”
A análise de vídeo captura uma ampla variedade de dados sobre as áreas cobertas por redes de câmeras inteligentes. Não é surpresa que agora as informações capturadas estejam sendo propostas para o policiamento preditivo: o uso de dados para prever e policiar o crime antes que ele aconteça.
Em 2002, o filme distópico “Minority Report” retratou uma sociedade que utiliza análises “pré-crime” para que a polícia intervenha na violação da lei antes que ela ocorra. No final, os oficiais encarregados tentaram manipular o sistema para seus próprios interesses.
Uma versão do mundo real do “Minority Report” está surgindo através de centros de criminalidade em tempo real usados para analisar padrões de criminalidade para a polícia. Nesses centros, as agências policiais ingerem informações de fontes como redes de mídia social, corretores de dados, bancos de dados públicos, registros criminais e ShotSpotters. Os dados climáticos são incluídos até por seu impacto sobre o crime (porque “bandidos não gostam de se molhar”).
Em um documento de 2018, a empresa de armazenamento de dados Western Digital e a consultoria Accenture previram que redes de câmeras inteligentes em massa seriam implantadas “em três níveis de maturidade”. Essa adoção em vários estágios, eles alegaram, “permitiria que a sociedade” abandonasse gradualmente as “preocupações” sobre privacidade ”e, em vez disso,“ aceitar e advogar ”pela vigilância em massa da polícia e do governo no interesse da“ segurança pública ”.
O nível 1 abrange o presente em que a polícia usa redes de CFTV para investigar crimes após o fato.
Em 2025, a sociedade alcançará o Nível 2 à medida que os municípios se transformarem em cidades “inteligentes”, afirmou o documento. Empresas e instituições públicas, como escolas e hospitais, conectam feeds de câmeras a agências governamentais e policiais para informar sistemas de análise centralizados e habilitados para IA.
A camada 3, o sistema de vigilância mais preditivo, chegará até 2035. Alguns residentes doarão voluntariamente seus feeds de câmeras, enquanto outros serão “encorajados a fazê-lo por incentivos fiscais ou compensação nominal”. Um “ecossistema de segurança pública” centralizará os dados “extraídos de bancos de dados diferentes, como mídias sociais, carteiras de motorista, bancos de dados policiais e dados escuros”. Uma unidade de análise habilitada para IA permitirá que a polícia avalie “anomalias em tempo real e interrompa um crime antes que ele seja cometido”.
Ou seja, pegar o pré-crime.
Ascensão do Complexo Industrial de Vigilância por Vídeo
Embora a vigilância por CFTV tenha começado como uma ferramenta simples para a justiça criminal, ela se transformou em uma indústria multibilionária que abrange vários setores da indústria. Do policiamento e cidades inteligentes às escolas, unidades de saúde e varejo, a sociedade está se movendo em direção à vigilância visual quase completa dos espaços comerciais e urbanos.
A Milestone Systems, com sede na Dinamarca, um dos principais fornecedores de VMS com metade de sua receita nos EUA, possuía menos de 10 funcionários em 1999. Hoje eles são uma grande corporação que possui escritórios em mais de 20 países.
A Axis Communications costumava ser uma impressora de rede. Desde então, eles se tornaram um fornecedor líder de câmeras, gerando mais de US $ 1 bilhão em vendas por ano.
BriefCam começou como um projeto universitário. Agora, ele está entre os principais fornecedores de análise de vídeo do mundo, com clientes, em mais de 40 países.
Nos últimos seis anos, a Canon comprou os três, dando ao conglomerado de imagens a propriedade de gigantes do setor em software de gerenciamento de vídeo, câmeras de CFTV e análise de vídeo. A Motorola adquiriu recentemente um dos principais fornecedores de VMS, a Avigilon, por US $ 1 bilhão. Por sua vez, a Avigilon e outras grandes empresas compraram suas próprias empresas.
O público está pagando por sua própria vigilância de alta tecnologia três vezes.
Grandes gigantes da tecnologia familiares também participam da ação. O tenente Patrick O’Donnell, da polícia de Chicago, me disse que seu departamento está trabalhando em um acordo de não divulgação com o Google para um projeto piloto de análise de vídeo para detectar pessoas que reagem a tiros e, se estiverem em posição de bruços, para que a polícia possa receber alertas em tempo real. (O Google não respondeu a uma solicitação de comentário.)
As redes de monitoramento de vídeo inevitavelmente envolvem e envolvem todo um ecossistema de fornecedores, alguns dos quais ofereceram, ou ainda podem oferecer, serviços especificamente direcionados a esses sistemas. Microsoft, Amazon, IBM, Comcast, Verizon e Cisco estão entre aqueles que habilitam as redes com tecnologias como serviços em nuvem, conectividade de banda larga ou software de vigilância por vídeo.
No setor público, o Instituto Nacional de Padrões e Tecnologia está financiando “análises públicas” e redes de comunicação como a First Responder Network Authority, ou FirstNet, para vídeo em tempo real e outras tecnologias de vigilância. O FirstNet custará US $ 46,5 bilhões e está sendo construído pela AT&T.
O Voxel51 é outro empreendimento apoiado pelo NIST. O público está, portanto, pagando por sua própria vigilância de alta tecnologia três vezes: primeiro, através de impostos para pesquisa universitária; segundo, mediante doação de dinheiro para a formação de uma startup com fins lucrativos (Voxel51); e terceiro, através da compra dos serviços do Voxel51 pelos departamentos de polícia da cidade, usando fundos públicos.
Com o setor público e privado procurando expandir a presença de câmeras, a videovigilância tornou-se uma nova vaca leiteira. Como disse Corso, “haverá algo como 45 bilhões de câmeras no mundo dentro de algumas décadas. São muitos pixels (de vídeo). Na maior parte, a maioria desses pixels não é utilizada. ”A estimativa de Corso reflete uma previsão de 2017 da empresa de capital de risco LDV de Nova York, que acredita que os smartphones evoluirão para ter ainda mais câmeras do que hoje, contribuindo para o crescimento.
As empresas que começaram com mercados de polícia e segurança agora estão diversificando suas ofertas para o setor comercial. BriefCam, Milestone e Axis anunciam o uso de análise de vídeo para os varejistas, onde eles podem monitorar o tráfego de pedestres, a duração da fila, os padrões de compras, os layouts de piso e a realização de testes A / B. O Voxel51 possui uma opção criada para a indústria da moda e planeja expandir-se nas verticais da indústria. A Motionloft oferece análises para cidades inteligentes, varejistas, imóveis comerciais e locais de entretenimento. Outros exemplos são abundantes.
Os atores do setor público e privado estão pressionando por um mundo cheio de vigilância por vídeo inteligente. Peleg, por exemplo, me falou de um caso de uso para cidades inteligentes: se você dirige para a cidade, pode “simplesmente estacionar e ir para casa” sem usar um medidor de estacionamento. A cidade enviaria uma conta para sua casa no final do mês. “Claro, você perde sua privacidade”, acrescentou. “A questão é: você realmente se importa com o Big Brother sabe onde está, o que faz, etc.? Algumas pessoas podem não gostar.
Como restringir a vigilância inteligente
Aqueles que não gostam de novas formas de vigilância do Big Brother estão atualmente fixados no reconhecimento facial. No entanto, eles ignoraram amplamente a mudança para redes de câmeras inteligentes – e o complexo industrial que a impulsiona.
Agora, milhares de câmeras estão programadas para examinar cada movimento, informando às autoridades da cidade se estamos andando, correndo, andando de bicicleta ou fazendo algo “suspeito”. Com a análise de vídeo, a inteligência artificial é usada para identificar nosso sexo, idade e tipo de roupas e poderia ser usado para nos categorizar por raça ou vestuário religioso.
Essa vigilância pode ter um efeito severo sobre a nossa liberdade de expressão e associação. É neste mundo que queremos viver?
A capacidade de rastrear indivíduos através de redes inteligentes de CFTV pode ser usada para atingir comunidades marginalizadas. A detecção de “vadiar” ou “furtar lojas” por câmeras concentradas em bairros pobres pode aprofundar o viés racial nas práticas de policiamento.
Esse tipo de discriminação racial já está ocorrendo na África do Sul, onde a “detecção incomum de comportamento” é implementada por redes de câmeras inteligentes há vários anos.
Nos Estados Unidos, as redes de câmeras inteligentes estão surgindo e há pouca informação ou transparência sobre seu uso. No entanto, sabemos que a vigilância tem sido usada ao longo da história para atingir grupos oprimidos. Nos últimos anos, o Departamento de Polícia de Nova York espionou secretamente muçulmanos, o FBI usou aviões de vigilância para monitorar os manifestantes do Black Lives Matter, e a Alfândega e Proteção de Fronteiras dos EUA começou a construir uma “fronteira inteligente” de vigilância por vídeo de alta tecnologia em todo o Tohono O ‘. reserva de odham no Arizona.
Agências policiais afirmam que redes de câmeras inteligentes reduzirão o crime, mas a que custo? Se uma câmera pudesse ser colocada em todos os cômodos de toda casa, a violência doméstica poderia cair. Poderíamos adicionar “filtros” automatizados que registram apenas quando um ruído alto é detectado ou quando alguém pega uma faca. A polícia deve colocar câmeras inteligentes em todas as salas de estar?
O setor comercial também está racionalizando o avanço do capitalismo de vigilância no domínio físico. Varejistas, empregadores e investidores querem nos colocar sob vigilância por vídeo inteligente, para que possam nos gerenciar com “inteligência” visual.
Quando perguntados sobre privacidade, vários departamentos policiais importantes me disseram que têm o direito de ver e registrar tudo o que você faz assim que sai de casa. Os varejistas, por sua vez, nem abordam a divulgação pública: eles mantêm suas práticas de análise de vídeo em segredo.
Nos Estados Unidos, geralmente não existe uma “expectativa razoável” de privacidade em público. A Quarta Emenda abrange a casa e algumas áreas públicas que “razoavelmente” esperamos ser privadas, como uma cabine telefônica. Quase todo o resto – nossas ruas, nossas lojas, nossas escolas – é um jogo justo.
Mesmo se as regras forem atualizadas para restringir o uso da vigilância por vídeo, não podemos garantir que essas regras permaneçam em vigor. Com milhares de câmeras de alta resolução conectadas em rede, um estado de vigilância distópica está a um clique do mouse. Ao instalar câmeras em todos os lugares, estamos abrindo uma caixa de Pandora.
Para lidar com as ameaças à privacidade das redes de câmeras inteligentes, os legisladores devem proibir as redes de vigilância de plug-ins e restringir o escopo dos CFTVs em rede além da premissa de um único site. Eles também devem limitar a densidade da cobertura da câmera e do sensor em público. Essas medidas bloqueariam a capacidade de rastrear pessoas em grandes áreas e impediriam que o fenômeno fosse constantemente observado.
O governo também deve proibir análises de videovigilância em espaços acessíveis ao público, talvez com exceções em casos raros, como a detecção de corpos nos trilhos do trem. Essa proibição desincentivaria as implantações de câmeras em massa porque a análise de vídeo é necessária para analisar grandes volumes de imagens. Os tribunais devem reconsiderar urgentemente o escopo da Quarta Emenda e expandir nosso direito à privacidade em público.
Departamentos de polícia, vendedores e pesquisadores precisam divulgar e divulgar seus projetos e se envolver com acadêmicos, jornalistas e sociedade civil.
É claro que temos uma crise em andamento. Precisamos ir além da conversa limitada de reconhecimento facial e abordar o mundo mais amplo da vigilância por vídeo, antes que seja tarde demais.