Lamphone: Een nieuw soort “visuele afluistermethode”

Een gloeilamp is het enige technische hulpmiddel dat Lamphone nodig had om een gesprek in een geluiddichte kamer af te luisteren.

Nog niet zo lang geleden schreven we over de methodes die Mordechai Guri en zijn collega’s aan de Ben-Gurion Universiteit ontwierpen om informatie aan een apparaat te onttrekken dat niet alleen niet verbonden was met het internet, maar ook nog eens fysiek van het netwerk was geïsoleerd. Bij de conferentie Black Hat USA 2020 presenteerde een andere wetenschapper van de Ben-Gurion Universiteit een rapport over een gerelateerd onderwerp. Ben Nassi sprak over de visuele afluistermethode die hij en zijn collega’s Lamphone hebben genoemd.

We gaan het later hebben over hoe Lamphone werkt, maar laten we beginnen met een kort uitstapje naar de geschiedenis van dit probleem.

Hoe is het mogelijk om geluid te zien?

Een bekende technologie voor het op afstand opnemen van geluid met gebruik van zogenaamde visuele methodes is de lasermicrofoon. Deze techniek is vrij eenvoudig.

De mensen die een gesprek aftappen richten een laserstraal die binnen het infraroodbereik actief is (dus onzichtbaar is voor het menselijk ook) op een geschikt oppervlak (normaal gesproken het glas van een raam) in de kamer waar dit gesprek plaatsvindt. De straal reflecteert via het oppervlak en raakt de ontvanger. Geluidsgolven creëren trillingen op het oppervlak van het voorwerp, die op hun beurt het gedrag van de gereflecteerde laserstraal veranderen. De ontvanger registreert deze veranderingen, en die worden uiteindelijk omgezet naar een geluidsopname van het gesprek.

Deze technologie wordt al sinds de Koude Oorlog gebruikt en is in vele spionagefilms te zien. U hebt het vast ook wel eens gezien. Tal van bedrijven produceren kant-en-klare apparaten voor het afluisteren via een laser, en het bereik ervan loopt op tot wel 500 of zelfs 1000 meter. Voor degenen die zich zorgen maken dat ze slachtoffer kunnen worden van afluisterpraktijken met een laser is er ook goed nieuws: ten eerste zijn lasermicrofoons zeer duur; en ten tweede verkopen fabrikanten lasermicrofoons alleen aan overheidsinstellingen (of dat beweren ze tenminste).

Volgens Nassie is de actieve aard van lasermicrofoons echter een ernstig nadeel. Om ervoor te zorgen dat deze manier van afluisteren werkt, moet je een oppervlakte “verlichten” met een laserstraal, en dat betekent dat een infrarooddetector hem kan ontdekken.

Een aantal jaar geleden kwam een groep onderzoekers van het Massachusetts Institute of Technology met een alternatieve methode voor “visuele opnames” die volledig passief was. Hun idee was grotendeels hetzelfde: geluidsgolven creëren trillingen op het oppervlak van het voorwerp. Die trillingen kunnen uiteraard worden geregistreerd.

Om dat te doen, gebruikten de onderzoekers een hogesnelheidscamera op meerdere duizenden frames per seconde. Door de frames van de camera (met behulp van een computer) te vergelijken, konden ze geluid nabootsen van de aaneenschakeling van videoframes.

Deze methode heeft ook een nadeel, en dat is geen kleinigheid. De hoeveelheid rekenkracht die nodig is om de enorme hoeveelheid aan visuele informatie van de hogesnelheidscamera in geluid om te zetten was buitengewoon. Zelfs met gebruik van een extreem krachtig werkstation hadden de MIT-onderzoekers 2–3 uur nodig om een videopname van 5 seconden te analyseren, dus deze aanpak is duidelijk niet erg geschikt voor het “eventjes” afluisteren van een gesprek.

Hoe Lamphone werkt

Nassi en zijn collega’s hebben een nieuwe “visuele afluistertechniek” bedacht die ze Lamphone noemen. Het voornaamste idee van deze methode is het gebruik van een gloeilamp (vandaar de naam van de techniek) als voorwerp waar je de trillingen die door het geluid worden veroorzaakt mee opvangt.

Een gloeilamp is niet alleen een zeer alledaags voorwerp, maar ook nog eens erg helder. Hierdoor hoeft iemand die de trillingen van een gloeilamp gebruikt geen rekenkracht te verspillen aan het analyseren van extreem subtiele veranderingen in beeld. Het enige dat ze hoeven te doen is een krachtige telescoop op de gloeilamp richten. De telescoop richt de lichtstroom van de gloeilamp vervolgens op een elektro-optische sensor.

De gloeilamp straalt licht niet op perfect uniforme wijze in verschillende richtingen uit (het interessant om op te merken dat deze ongelijkheid ook varieert aan de hand van verschillende soorten gloeilampen, waarbij deze vrij hoog is voor gloeilampen en ledlampen en veel lager voor fluorescente lampen). Deze ongelijkheid zorgt ervoor dat de trillingen van de lamp (veroorzaakt door geluidsgolven) de intensiteit van de lichtstroom enigszins beïnvloeden, wat door de elektro-optische sensor wordt waargenomen. En die veranderingen zijn waarneembaar genoeg voor een opname. Na het opnemen van de veranderingen en het maken van een aantal eenvoudige transformaties, konden de onderzoekers het geluid van de daaruit voortvloeiende “lichtopname” herstellen.

Om hun methode te testen, installeerden de onderzoekers een afluisterapparaat op een voetgangersburg op 25 meter van het raam van de testkamer, waarin geluid via een speaker werd afgespeeld. Door een telescoop op een lamp in de kamer te richten, konden de onderzoekers de lichtvariaties registreren en deze omzetten in een geluidsopname.

De opnames bleken vervolgens behoorlijk begrijpelijk te zijn. Shazam identificeerde bijvoorbeeld de testliedjes “Let It Be” van The Beatles en “Clocks” van Coldplay, en de spraakherkenningssoftware van Google transcribeerde de woorden van Donald Trump tijdens een van zijn verkiezingstoespraken correct.

Vormt Lamphone in de praktijk een dreiging?

Nassi en zijn collega’s hebben op succesvolle wijze een daadwerkelijk functionele methode voor “visuele afluisterpraktijken” ontworpen. En belangrijker nog: deze methode is volledig passief en kan daardoor niet gedetecteerd worden.

Merk hierbij ook op dat in tegenstelling tot de methode van de onderzoekers van MIT, de berekeningen voor het decoderen van Lamphone-opnames extreem simpel zijn. Omdat er geen enorme rekenkracht nodig is voor het verwerken, kan Lamphone in real-time gebruikt worden.

Nassi geeft echter toe dat tijdens het experiment het geluid in de testkamer op zeer hoog volume werd afgespeeld. Daarom zijn de resultaten van het experiment momenteel vooral theoretisch gezien interessant. Aan de andere kant mogen we de eenvoud van de methodes die gebruikt worden om “lichtopnames” in geluid om te zetten niet onderschatten. De techniek kan mogelijk verder worden verfijnd met gebruik van machine-learning-algoritmes, die uitstekend zijn voor dit soort taken.

Op dit moment beoordelen de onderzoekers de huidige haalbaarheid van de toepassing van deze techniek in de praktijk niet als extreem moeilijk noch als gemakkelijk, maar hier ergens tussenin. Ze voorspellen echter dat de methode mogelijk een stuk praktischer kan worden, zeker als iemand erin slaagt om geavanceerde algoritmes te gebruiken om de lezingen van de elektro-optische sensor in geluidsopnames om te zetten.

Tips