========================================
Я думаю, что крупные компании-производители ПО, такие как Microsoft, вступили в сговор с крупными производителями процессоров (Интел и АМД), с целью "деоптимизации" ПО. То есть, производительность процессоров растет, и если производительность ПО не будет падать, то покупать новые процессоры никто не будет. Поэтому ПО разными неявными методами замедляется.
Чему постоянно нахожу мелкие подтверждения. Вот например, оцените мессидж с форума alteraforum.com.
As a long time hardware and software engineer, the notion "find your critical path and spend as much time as necessary to find the fastest possible way to implement that" is as natural as breathing. When I wrote a 3D graphics (game/simulation) engine recently, I noticed the "transform vertex positions to [world (or display)] coordinates" was the most often executed "critical path" in the engine. All the lazy numbhead engineers said the same thing, "you cannot possibly do better than the [OpenGL/DirectX] routines - they have been optimized by the smartest geniuses in the universe". Stubborn doofus that I am, I proceeded to break my butt to totally, clearly understand what needed to be done, and what would be the most efficient data-organization, algorithm-organization and implementation to implement this part of the algorithm. So I ended up coding one 32-bit and one 64-bit set of SIMD/SSE2+ assembly language code to perform this functionality and the result was... [drum roll, please]... my entire program became 6+ times faster. This did not shock me. But, as usual, everyone else who had warned me not to waste my time and effort, did what they always do - they just shrugged, said nothing, and walked away.
========================================
В английском тексте говорится, что автор на коленке написал программу очень часто выполняемого преобразования координат в трехмерной графике, которая работает более чем в 6 раз быстрее, чем та же функция всюду применяемых высокопрофессиональных глубокоуважаемых графических пакетов OpenGL/DirectX.