Suche
  • Anna

Woman of the Month November 2020: Wenjuan Yang

Aktualisiert: Jan 17




Wenjuan hat zunächst an der Lanzhou University Physik studiert, anschließend hat sie an der Tsinghua University promoviert in theoretischer und mathematischer Physik. Sie arbeitete als Postdoc Researcher am Max Planck Institut und wirkte bei Projekten im Bereich Data Science und Machine Learning mit.


Wir haben das Interview aus dem Englischen übersetzt; die Originalfassung findet ihr weiter unten.


[Anna] Woher kommt dein Interesse an Data Science und Deep Learning?


[Wenjuan] Ich habe mich schon immer für neuartige Technologien interessiert, die einen großen Einfluss auf das Leben des Menschen haben können. Nach dem Erscheinen von AlphaGo begann ich, die Entwicklung von künstlicher Intelligenz zu verfolgen. Während meiner Promotion wurden immer mehr Arbeiten über maschinelles Lernen und Deep Learning in führenden Physikzeitschriften veröffentlicht, so dass ich begann, künstlicher Intelligenz mehr Aufmerksamkeit zu widmen.


[Anna] Inwiefern ist dein Studium der Physik hilfreich für deine Arbeit im Bereich Deep Learning?


[Wenjuan] Die Hauptaufgabe eines:r Physikers:in ist es, die Gesetze der Natur zu finden, und die Arbeit von Datenwissenschaftler:innen besteht darin, geeignete Algorithmen zu finden, um die Muster in massiven Daten zu erkennen. In dieser Hinsicht haben die Physik und Data Science Gemeinsamkeiten. Während meiner Doktorarbeit und meiner Postdoc-Forschungsarbeit wurde ich darin geschult, komplizierte Fälle zu entwirren, sowie die Probleme zu klären und zu lösen, indem ich geeignete Modelle verwende. Diese Trainings sind sehr hilfreich, wenn ich im Bereich Deep Learning arbeite, vor allem für den Aufbau geeigneter Modelle nach dem Aussortieren der Probleme.


[Anna] Bitte beschreib das Projekt, an dem du derzeit als Machine Learning Engineer arbeitest.


[Wenjuan] Es ist eine Zusammenarbeit von Omdena und Save the Children, um den Online-Missbrauch von Kindern und schädliches Verhalten anhand von Daten aus Zeitungen, sozialen Medien, Spielforen und Forschungsarbeiten zu verstehen, indem NLP genutzt wird. Ich konzentrierte mich vor allem auf die Aufgabe, Online-Angreifer automatisch zu identifizieren, einschließlich der Erstellung eines Modells zur Klassifizierung von diesen Angreifern und eines Chatbots zur Nachahmung des Verhaltens der Opfer.


[Anna] Für welchen Bereich der künstlichen Intelligenz interessierst du dich besonders?


[Wenjuan] Ich interessierte mich immer mehr für Natural Language Processing (NLP), da es hier in den letzten zwei Jahren große Durchbrüche gab, beispielsweise das Erscheinen von einschlägigen Sprachmodellen wie BERT und GPT. Aber mittlerweile habe ich ein breiteres Interesse, wie z.B. Computer Vision, Zeitreihen, Signalverarbeitung. Im Bereich der Zeitreihen verwende ich jetzt Transformatormodelle, die hauptsächlich im NLP verwendet werden.


[Anna] Welche Chancen und/oder Risiken siehst du in der Entwicklung der künstlichen Intelligenz? Was glaubst du, wie unsere Welt in 20 Jahren aussehen wird?


[Wenjuan] Es gibt ein bekanntes Sprichwort in der Physik-Community: more is different. Es besagt, dass die Beschaffenheit eines Systems mit großen Skalen sehr verschieden von seinen kleineren Teilen ist. Auf dem Gebiet der künstlichen Intelligenz scheint dies ähnlich zu sein. Mit dem Aufkommen großer Daten haben wir die dramatische Entwicklung der KI miterlebt. Jetzt hat die KI bereits - oder wird in der nahen Zukunft - den Menschen bei bestimmten Aufgaben übertroffen, z.B. Gesichtserkennung, Autofahren, Sprachübersetzungen. Die künstliche Intelligenz könnte einen Teil der Arbeit automatisieren und dazu beitragen, die menschliche Arbeit zu ergänzen, insbesondere in gefährlichen Umgebungen, und neue höher qualifizierte Tätigkeiten im Zusammenhang mit der künstlichen Intelligenz bringen, z.B. Datenwissenschaftler:in, Robotikingenieur:in.

Auf der anderen Seite wird eine große Anzahl von Arbeitsplätzen wegfallen, wenn einige Aufgaben durch den Einsatz der KI automatisch erledigt werden. Ein weiteres Risiko der KI ist der Missbrauch der Technologie und die damit verbundenen Herausforderungen in ethischen, moralischen und rechtlichen Fragen. Mit der Entwicklung der Gesichtserkennungstechnologie in der KI ist es zum Beispiel für Kriminelle leichter, Identitätsbetrug zu begehen, und für Unternehmen (Regierungen) leichter, die Aktivitäten der Benutzer (Bürger) zu verfolgen (zu überwachen), indem sie persönliche Gesichtsdaten sammeln.

In 20 Jahren könnten wir als Folge der breiten Anwendung künstlicher Intelligenz analog zur weit verbreiteten Nutzung des Internets eine neue Welt sehen, und zwar sowohl auf gute als auch auf schlechte Weise.


[Anna] Siehst du irgendwelche potenziell negativen Nebenwirkungen oder sogar Konsequenzen der AI?


[Wenjuan] Wie ich bereits in den vorangegangenen Problemen erwähnt habe, kann KI zu Entlassungen, Datenschutz- und Sicherheitsproblemen führen. Hinzu kommt, dass aufgrund der Eigenschaft von Algorithmen beim Deep Learning die Verzerrung in der realen Welt durch künstliche Intelligenz verstärkt werden kann. So wurde beispielsweise in einem Paper darauf hingewiesen, dass ein weit verbreitetes NLP-Modell, das auf Google News trainiert wurde, Geschlechterstereotypen aufweisen kann, z.B. im Vektorraum Mann - Frau ≈ Computerprogrammierer - Hausfrau.


[Anna] Vielen Dank für deine Zeit!



Wenjuan ist zurzeit aktiv auf der Suche nach einer Stelle im Bereich Data Science. Ihr könnt sie gern über LinkedIn kontaktieren.





Englische Originalfassung


[Anna] Where does your interest in data science and deep learning come from?


[Wenjuan] I have always been interested in the novel technology that may have a great impact on human's life. After the appearance of AlphaGo, I started to follow the development of AI. Meanwhile, during my PhD study, more and more papers related to machine learning and deep learning were published in top physics journals, so I started to pay more attention to artificial intelligence.


[Anna] In which way is your study of physics helpful for your work in Deep Learning?


[Wenjuan] The main task of a physicist is to find the laws in nature, and the work of data scientists is to find proper algorithms to recognize the patterns in massive data. From this aspect, physics and data science share similarities. During my PhD and Postdoc research, I have been trained to untangle complicated cases, further clarify and resolve the problems by utilising suitable models. These trainings are very helpful when I am working in Deep Learning, especially for building appropriate models after sorting out the problems.


[Anna] Please describe the project you are currently working on as a Machine Learning Engineer. (Omdena Projekt, Child Protection)


[Wenjuan] It’s a Omdena’s challenge collaborating with Save the Children to understand online abuse of children and predatory behaviour with data collected from newspapers, social media, game forums and research papers by leveraging NLP. I mainly focused on the task of automatically identifying online predators, including building a model to classify predators and a chatbot to mimic the behaviour of victims.


[Anna] What area of artificial intelligence are you particularly interested in?


[Wenjuan] I was more interested in natural language processing (NLP), since in the past two years, there are great breakthroughs in NLP, i.e. the appearance of pertained language models like BERT and GPT. But currently I have a more broad interest, such as computer vision, time series, signal processing. I am now using transformer models (used primarily in NLP) in the field of time series.


[Anna] What opportunities and/or risks do you see in the development of artificial intelligence? How do you think our world will look like in 20 years?


[Wenjuan] There is a well-known saying in the physics community that more is different. It means the property of a system with large scales is very different from its smaller parts. This seems similar in the field of artificial intelligence. With the advent of big data, we have witnessed the dramatical development in AI. Now AI has already or in the near future can outperform humans in specific tasks, e.g. facial recognition, driving cars, language translations. AI could automate some work and help to complement human work especially in hazardous environments and bring new higher-skilled jobs related to AI, e.g. data scientist, robotics engineer.

On the other hand, with some tasks automatically done by utilising AI, a large number of jobs will be eliminated. Another risk of AI is the misuse of the technology and the raising challenges in ethical, moral and legal issues. For example, with the development of facial recognition technology in AI, it’s easier for criminals to commit identity fraud and for companies (governments) to track (monitor) users' (citizens') activities by collecting personal facial data.

In 20 years, we may see a new world as a consequence of the wide application of artificial intelligence analogous to the widespread use of the internet, both in a good and a bad way.


[Anna] Do you see any potentially negative side effects or even outcomes of AI?


[Wenjuan] As I mentioned in the previous problems, AI can cause layoffs, data privacy and security issues. In addition to these, because of the feature of algorithms in deep learning, the bias in real world can be amplified by artificial intelligence. For instance, a paper pointed out that a widely used NLP model trained on Google News can exhibit gender stereotypes, e.g. in vector space man - woman ≈ computer programmer - homemaker.


[Anna] Thank you very much for your time!



 
  • LinkedIn - Schwarzer Kreis
  • Twitter

©2020 Neurona.